AI vízfogyasztás: Miért megtévesztőek a vírálisan terjedő számok

Pár havonta egy újabb hírmagazin cím állítja, hogy egy ChatGPT-nak feltett kérdés egy üveg vizet fogyaszt. A számok riasztóan hangzanak, és gyorsan terjednek. De ha beleásod magad ezeknek az állításoknak a módszertanába, a kép jóval homályosabbá válik. Az AI vízfogyasztása vitaponttá vált a fenntarthatósági vitákban, mégis az online keringő vírális statisztikákból gyakran hiányzik az a kontextus, amely szükséges lenne ahhoz, hogy megértsük, mit is jelentenek valójában. A valóság árnyaltabb, és sok esetben jóval kevésbé drámai, mint ahogy a kritikusok sugallják.

Az online keringő AI vízfogyasztási statisztikák gyakran torzítják a valóságot, összekeverve az egyszeri modellképzést a folyamatos inferenciával, és egyetemesen alkalmazva a legrosszabb esetben felmerülő hűtési forgatókönyveket. A Google tényleges mérései szerint egy átlagos szöveges prompt körülbelül 0,26 milliliter vizet használ – közel 2000-szer kevesebbet, mint ahogy a vírális állítások sugallják. Míg az adatközpontok vízhiányos régiókban történő bővítése figyelmet érdemel, az iparág ökológiai lábnyoma a mezőgazdasághoz vagy a feldolgozóiparhoz képest továbbra is kicsi marad, a hatékonysági fejlesztések pedig folyamatosan és jelentősen csökkentik a lekérdezésenkénti erőforrás-felhasználást.

A vírális állítások az AI-ról és a vízről

A leggyakrabban idézett adat szerint egyetlen ChatGPT beszélgetés (amit gyakran 20-50 kérdésként határoznak meg) 500 ml vizet használ. Ez a szám egy 2023-as tanulmányból származik, amely azt is becsülte, hogy a GPT-3 képzése a Microsoft amerikai adatközpontjaiban közvetlenül 700 000 liter tiszta édesvizet párologtathat el. A statisztika technikailag pontos arra a konkrét forgatókönyvre, de kiszakították a kontextusból, és széles körben alkalmazták minden AI interakcióra, függetlenül a modelltől, a helyszíntől vagy az infrastruktúrától.

Ami egy konkrét modell konkrét létesítményekben történő képzésére vonatkozó szűk megállapításként indult, az az összes AI-használat egyetemes elítélésévé vált. Ez probléma. A képzés egyszer történik, az inferencia viszont milliárdyszor. E kettő összekeverése vadul megtévesztő következtetéseket eredményez.

Szalagcímek és a valóság

A “lekérdezésenként egy üveg víz” állítás összekeveri a képzést az inferenciával, figyelmen kívül hagyja a hűtési módszerek regionális különbségeit, és a legrosszabb forgatókönyveket feltételezi. A Google saját mérései másról tanúskodnak: a medián Gemini Apps szöveges prompt mindössze 0,26 milliliter vizet fogyaszt, nagyjából öt cseppet. Ez közel 2000-szer kevesebb, mint amit a fenti állítások sugallnak.

A számok közötti szakadék rávilágít arra, hogy a módszertan mennyire fontos. Egy arizonai képzést nyáron mérő tanulmány drámaian eltérő számokat fog eredményezni, mint egy finlandiai inferenciát télen mérő.

Hogyan számolják ki ezeket a számokat

A legriasztóbb becslések olyan hozzárendelési módszerekre támaszkodnak, amelyek az adatközpontok teljes vízhasználatát az AI munkaterhelésekhez rendelik, még akkor is, amikor ezek a létesítmények számtalan más szolgáltatást is futtatnak. Gyakran használnak csúcsfogyasztási adatokat a forró éghajlaton található vízigényes hűtési rendszerekből, majd ezeket a számokat globálisan alkalmazzák. Az AI ökológiai lábnyomának teljesítményértékelését megkísérlő kutatási keretrendszerek elismerik az alapvető akadályt: a kereskedelmi AI szolgáltatók nem teszik közzé a modellspecifikus inferencia-adatokat, kényszerítve a kutatókat olyan feltételezésekre, amelyek drámaian felfújhatják a becsléseket.

Hogyan működik az adatközponti hűtés a valóságban

Az AI vízfogyasztásának megértéséhez tudni kell, hogyan kezelik az adatközpontok a hőt. A szerverek hőt termelnek a számítások során, és ezt a hőt el kell távolítani a berendezések meghibásodásának megelőzése érdekében. A választott módszer nagymértékben függ az éghajlattól, a helyi erőforrásoktól és a hatékonysági prioritásoktól. Egy phoenixi létesítmény nagyon másképp működik, mint egy stockholmi, mégis a kritikusok gyakran azonosként kezelik őket a környezeti hatás kiszámításakor.

Hűtési rendszerek bemutatása

A hagyományos levegős hűtés ventilátorokat és légkondicionálást használ, viszonylag kevés vizet, de több áramot fogyaszt. A párologtatásos hűtés, amely egyre népszerűbb a nagy létesítményekben, vizet cserél energiahatékonyságért a hő elpárologtatásával. Az újabb megközelítések, mint például a folyadékos merítéses hűtés, nem vezető folyadékba merítik a berendezéseket, így teljesen kiküszöbölik a vízhasználatot.

A választás a helyi feltételektől függ. A vállalatok egyre inkább olyan helyszíneken létesítenek adatközpontokat, ahol a vízhiány a legkisebb és a megújuló energia bőséges, ami az általánosító kijelentéseket eleve megtévesztővé teszi.

Vízkivétel és vízfogyasztás

A kritikusok gyakran összekeverik a vízkivételt a vízfogyasztással. A kivétel azt a vizet jelenti, amelyet egy forrásból kinyernek; a fogyasztás azt a vizet jelenti, amely nem tér vissza. Sok hűtési rendszer kivett vizet, felhasználja, és annak nagy részét visszajuttatja a forráshoz. A különbségtétel hatalmas jelentőséggel bír: egy létesítmény millió liter vizet vonhat ki, miközben ténylegesen csak töredékét fogyasztja el. A vállalatok biztonságos AI megoldásainak értékelésekor ennek a különbségnek a megértése segít elválasztani a valódi aggodalmakat a felfújt statisztikáktól.

Az AI vízfogyasztási számok kontextusba helyezése

A kontextus nélküli számok megtévesztőek. Az adatközpontok az amerikai édesvíz-fogyasztás körülbelül 0,2%-át teszik ki. Ez nagynak hangzik, amíg össze nem hasonlítjuk más iparágakkal. A mezőgazdaság a globális édesvíz-kivétel körülbelül 70%-áért felel. Egyetlen arizonai golfpálya évente több vizet használ, mint sok adatközpont. A kérdés nem az, hogy használ-e vizet az AI; hanem az, hogy ez a használat arányos-e az értékével és összehasonlítható-e az alternatívákkal.

Iparági összehasonlítások

Fontolja meg ezeket az arányokat:

Egy kilogramm marhahús előállítása globálisan körülbelül 15 000 liter vizet igényel. Ez azonban nagyrészt esővel táplált “zöld” víz; a tényleges “kék” víz (folyókból és víztárolókból nyert) az USA-ban körülbelül 2000 liter, ami még mindig hatalmas mennyiség a digitális szolgáltatásokhoz képest.
Egyetlen pamut póló gyártása körülbelül 2700 liter vizet használ, nagyrészt a pamut magas öntözési igénye és az intenzív festési folyamat miatt.
Egy tipikus félvezetőgyár évente milliárd liter vizet fogyaszt.
A hőerőművek jóval több vizet használnak, mint az összes adatközpont együttvéve.

Az adatközpontok továbbra is csak kis részét teszik ki az amerikai vízhasználatnak. Az AI iparág ökológiai lábnyoma, bár növekszik, szerény marad az olyan bevált iparágakhoz képest, amelyek ritkán kapnak hasonló vizsgálatot. Senki nem oszt meg vírális bejegyzéseket a reggeli kávéja vízlábnyomáról, pedig egyetlen csésze előállításához nagyjából 140 liter víz szükséges, ha figyelembe vesszük a bab termesztését és feldolgozását.

Mindennapi tevékenységek

A Google mérései perspektívába helyezik az AI lekérdezéseket: egyetlen szöveges prompt kevesebb mint kilenc másodperces tévénézésnek megfelelő energiát használ. A videóstreamelés, az e-mail szerverek üzemeltetése és az okostelefonok töltése mind erőforrásokat fogyaszt. A Netflix-zésedet vagy az Instagram-görgetésedet támogató infrastruktúra hasonló hűtési rendszereket használ. Az AI egyedüli kiemelése, miközben a hasonló digitális tevékenységeket figyelmen kívül hagyják, torz képet fest a technológia környezeti hatásáról.

Mit tesznek valójában a technológiai vállalatok

Az a narratíva, hogy a technológiai vállalatok figyelmen kívül hagyják a környezeti aggályokat, nem felel meg a valóságnak. A nagy szolgáltatók jelentős összegeket fektettek a hatékonysági fejlesztésekbe és az alternatív vízforrásokba. A Google 2024-ben 12%-kal csökkentette adatközpontjai energia-kibocsátását annak ellenére, hogy a villamosenergia-igénye 27%-kal nőtt. A Microsoft vállalta, hogy 2030-ra vízpozitívvá válik. Ezek lehetnek csak PR-nyilatkozatok, de gyakran milliárdos infrastrukturális beruházásokat képviselnek.

Az iparágnak erős pénzügyi ösztönzői vannak a fogyasztás csökkentésére. A víz és az energia költségei közvetlenül hatnak a haszonkulcsra, ami a hatékonysági fejlesztéseket nyereségessé, nem pedig pusztán altruistává teszi.

Nem ivóvíz-források

Számos modern adatközpont újrahasznosított szennyvizet, tisztított szürkevizet vagy tengervizet használ hűtésre, ahelyett, hogy versenyezne a városi ivóvízellátással. A helyszín kiválasztásakor egyre inkább előtérbe helyezik azokat a régiókat, ahol bőséges a víz és tiszta az energiaellátás. A Cornell kutatói megállapították, hogy az okos helyszínválasztás, kombinálva a működési hatékonysággal, 86%-kal csökkentheti az AI vízhatását a legrosszabb forgatókönyvekhez képest. A Közép-Nyugat és a “szélövezet” (windbelt) államok kínálják a legjobb kombinált szén- és vízprofilt az új létesítmények számára.

Hatékonysági fejlesztések

A Google adatközpontok most 84%-kal kevesebb rezsit energiát használnak az iparági átlagnál. Egy legutóbbi 12 hónapos időszak alatt a medián Gemini szöveges promptok energia- és szénlábnyoma 33-szor, illetve 44-szer csökkent. A Vízhászonnálati Hatékonyság (WUE) mutatók folyamatosan javultak az egész iparágban. Ezek a nyereségek halmozódnak: a hatékonyabb modellek, amelyek hatékonyabb hardvereken futnak hatékonyabb létesítményekben, drámaian csökkentik a lekérdezésenkénti erőforrás-felhasználást.

A valódi fenntarthatósági beszélgetés

Az összes AI-val kapcsolatos környezeti aggodalom elvetése ugyanolyan megtévesztő lenne, mint a vírális statisztikák kritikátlan elfogadása. Az iparág valóban komoly kihívásokkal néz szembe, különösen a vízhiányos régiókban történő gyors bővülés körül. Az elmúlt három évben több mint 160 új AI adatközpont jelent meg az Egyesült Államokban, némelyikük már aszálytól sújtott területeken. A kérdés nem az, hogy van-e az AI-nak környezeti hatása; hanem az, hogy ez a hatás felelősen kezelt-e, és arányos-e a nyújtott előnyökhöz.

Jogos aggodalmak és pánik

Az érvényes kritikák közé tartozik a szolgáltatók átláthatóságának hiánya, a létesítmények már amúgy is terhelt régiókban történő csoportosulása, valamint a vízjogok elégtelen szabályozási felügyelete. Ami túlzó: az az állítás, hogy az AI egyedülállóan pusztító más digitális szolgáltatásokhoz képest, vagy hogy az egyedi lekérdezések jelentős környezeti kárt okoznak. Az olyan AI szolgáltatások értékelésekor, amelyek nem képeznek az Ön adataiból, az ökológiai lábnyom megérdemli a figyelmet az adatvédelem mellett, de a pánikra épülő statisztikák nem segítenek senkit sem megalapozott döntéseket hozni.

Jobb kérdések, amelyeket fel kell tenni

Ahelyett, hogy azt kérdeznénk, “mennyi vizet használ az AI?”, kérdezzük meg: Hol található ez az adatközpont, és milyen a helyi vízhelyzet? Milyen hűtési technológiát használ? Mi az energiaforrás? A szolgáltató közzéteszi-e az ellenőrzött környezeti mutatókat? Ezek a kérdések cselekvésre alkalmas információkat eredményeznek. Az átláthatóság megkövetelése és a valódi hatékonysági fejlesztéseket demonstráló szolgáltatók támogatása jobb ösztönzőket teremt, mint a megtévesztő statisztikák megosztása.

Alacsonyabb hatású alternatíva: Nyílt forráskódú AI

A modellválasztás jobban befolyásolja az ökológiai lábnyomot, mint ahogy a legtöbb felhasználó gondolná. Az olyan következtető modellek, mint az o3 és a DeepSeek-R1, hosszú promptonként meghaladják a 29 Wh-t, ami több mint 65-szöröse a kisebb modellek fogyasztásának. A tényleges igényeknek megfelelő, megfelelő méretű modellek kiválasztása csökkenti az erőforrás-felhasználást a hasznosság feláldozása nélkül. A nyílt forráskódú modellek gyakran elosztottabb, hatékonyabb infrastruktúrán futnak, mint a masszív zárt rendszerek.

Miért használnak kevesebb vizet a nyílt forráskódú modellek

A nyílt forráskódú AI legújabb innovációi drámaian javították a hatékonyságot az olyan architektúrákon keresztül, mint a Szakértői Keverék (Mixture-of-Experts, MoE). Ahelyett, hogy a teljes modellt futtatnák minden szónál, ezek a modellek csak a hálózatuk egy kis részét aktiválják. Például a legutóbbi nyílt forráskódú modell, a MiniMax M2.5 230 milliárd paraméterrel rendelkezik, de az inferencia során csak körülbelül 10 milliárdot (4,3%) aktivál. Hasonlóan a GLM-5 744 milliárd paramétert tartalmaz, de csak 40 milliárdot aktivál.

Ez azt jelenti, hogy ezeknek a rendkívül képes nyílt forráskódú modelleknek a futtatása sokkal kevesebb számítási teljesítményt, energiát és végső soron hűtési vizet igényel, mint a masszív sűrű modellek, amelyek minden egyetlen tokennél több száz milliárd paramétert aktiválnak. A GDPR-megfelelő AI lehetőségek megértése gyakran vezet ezeknek a rendkívül hatékony alternatíváknak a felfedezéséhez, amelyek az erőforrás-lábnyék töredékével szolgáltatnak egyenértékű üzleti eredményeket.

Próbálja ki a DentroChatot: Európa fenntartható AI alternatívája

Az európai adatközpontok általában hűvösebb éghajlaton, tiszta energiaellátó hálózatokkal működnek, ami csökkenti mind a víz-, mind a szénlábnyomot. Például a nagy skandináv adatközpont-üzemeltetők, mint az atNorth jelentése szerint a Vízhászonnálati Hatékonyság (WUE) mindössze 0,1 liter kWh-ként. Ez sokkal alacsonyabb az 1,8 L/kWh-os iparági átlagnál. Továbbá a finnországi, izlandi és svédországi létesítmények aktívan újrahasznosítják a szerverhőt távfűtésre és élelmiszer-termelésre, ahelyett, hogy vizet párologtatnának el.

A DentroChat nyílt forráskódú modelleket futtat európai infrastruktúrán, alacsonyabb hatású alternatívát kínálva a GPT vagy a Claude helyett azoknak a felhasználóknak, akiket az adatvédelem mellett a fenntarthatóság is érdekel. A hatékony modellek, kedvező helyszínek és átlátható működés kombinációja azt mutatja be, hogyan nézhet ki a felelős AI-telepítés.