← Blog

Consumo idrico dell'IA: perché i numeri virali sono fuorvianti

Consumo idrico dell'IA: perché i numeri virali sono fuorvianti

Ogni pochi mesi, un nuovo titolo sostiene che fare una domanda a ChatGPT divora una bottiglia d’acqua. I numeri suonano allarmanti e si diffondono rapidamente. Ma quando si analizza la metodologia dietro queste affermazioni, il quadro diventa notevolmente più confuso. Il consumo idrico dell’IA è diventato un punto di conflitto nei dibattiti sulla sostenibilità, tuttavia le statistiche virali che circolano online spesso mancano del contesto necessario per comprendere cosa significhino realmente. La realtà è più sfumata e, in molti casi, molto meno drammatica di quanto suggeriscano i critici.

Le statistiche sul consumo idrico dell’IA che circolano online spesso travisano la realtà, confondendo l’addestramento una tantum del modello con le query continue e applicando universalmente scenari di raffreddamento nel peggiore dei casi. Le misurazioni effettive di Google mostrano che un tipico prompt di testo utilizza circa 0,26 millilitri di acqua, quasi 2.000 volte in meno rispetto a quanto suggerito dalle affermazioni virali. Sebbene l’espansione dei data center in regioni sottoposte a stress idrico meriti attenzione, l’impronta dell’industria rimane piccola rispetto all’agricoltura o alla produzione, e i miglioramenti dell’efficienza continuano a ridurre significativamente l’uso di risorse per query.

Le affermazioni virali sull’IA e l’acqua

La cifra più comunemente citata suggerisce che una singola conversazione con ChatGPT (spesso definita come 20-50 domande) utilizza 500 ml di acqua. Questo numero ha origine da uno studio del 2023 che ha anche stimato che l’addestramento di GPT-3 nei data center americani di Microsoft potrebbe far evaporare direttamente 700.000 litri di acqua dolce pulita. La statistica è tecnicamente accurata per quello scenario specifico, ma è stata spogliata del suo contesto e applicata in modo ampio a ogni interazione con l’IA, indipendentemente dal modello, dalla posizione o dall’infrastruttura.

Quello che è iniziato come un risultato ristretto sull’addestramento di un modello specifico in strutture specifiche è diventato un’accusa universale contro tutto l’uso dell’IA. Questo è un problema. L’addestramento avviene una volta, ma l’inferenza avviene miliardi di volte. Confonderle produce conclusioni ampiamente fuorvianti.

Titoli contro realtà

L’affermazione “una bottiglia d’acqua per query” confonde l’addestramento con l’inferenza, ignora le variazioni regionali nei metodi di raffreddamento e presume scenari nel peggiore dei casi. Le misurazioni di Google raccontano una storia diversa: il prompt di testo mediano di Gemini Apps consuma solo 0,26 millilitri di acqua, circa cinque gocce. È quasi 2.000 volte in meno rispetto a quanto suggerito dalle suddette affermazioni.

Il divario tra queste cifre rivela quanto conti la metodologia. Uno studio che misura l’addestramento in Arizona durante l’estate produrrà numeri drasticamente diversi rispetto a uno che misura l’inferenza in Finlandia durante l’inverno.

Come vengono calcolati questi numeri

Le stime più allarmanti si basano su metodi di attribuzione che assegnano tutto l’utilizzo di acqua del data center ai carichi di lavoro dell’IA, anche quando quelle strutture eseguono innumerevoli altri servizi. Spesso utilizzano cifre di consumo di picco da sistemi di raffreddamento ad alta intensità di acqua in climi caldi, per poi applicare quei numeri a livello globale. I framework di ricerca che tentano di misurare l’impronta ambientale dell’IA riconoscono un ostacolo fondamentale: i provider di IA commerciali non divulgano i dati di inferenza specifici per modello, costringendo i ricercatori a fare supposizioni che possono gonfiare drammaticamente le stime.

Come funziona realmente il raffreddamento dei data center

Comprendere il consumo idrico dell’IA richiede la comprensione di come i data center gestiscono il calore. I server generano calore durante il calcolo e tale calore deve essere rimosso per prevenire guasti alle apparecchiature. Il metodo scelto dipende fortemente dal clima, dalle risorse locali e dalle priorità di efficienza. Una struttura a Phoenix opera in modo molto diverso da una a Stoccolma, eppure i critici spesso le trattano come identiche quando calcolano l’impatto ambientale.

I sistemi di raffreddamento spiegati

Il raffreddamento ad aria tradizionale utilizza ventilatori e condizionatori, consumando relativamente poca acqua ma più elettricità. Il raffreddamento evaporativo, sempre più popolare nelle grandi strutture, scambia acqua con efficienza energetica utilizzando l’evaporazione per dissipare il calore. Approcci più recenti come il raffreddamento a liquido per immersione sommergono le apparecchiature in fluidi non conduttivi, eliminando completamente l’uso dell’acqua.

La scelta dipende dalle condizioni locali. Le aziende posizionano sempre più le strutture dove lo stress idrico è minore e l’energia rinnovabile è abbondante, rendendo le dichiarazioni generalizzate intrinsecamente fuorvianti.

Prelievo contro Consumo

I critici spesso confondono il prelievo idrico con il consumo idrico. Il prelievo indica l’acqua prelevata da una fonte; il consumo indica l’acqua che non ritorna. Molti sistemi di raffreddamento prelevano acqua, la utilizzano e ne restituiscono la maggior parte alla fonte. La distinzione è di enorme importanza: una struttura potrebbe prelevare milioni di litri consumandone effettivamente solo una frazione. Quando si valutano soluzioni IA sicure per le aziende, comprendere questa differenza aiuta a separare le preoccupazioni genuine dalle statistiche gonfiate.

Mettere i numeri sul consumo idrico dell’IA nel giusto contesto

I numeri senza contesto fuorviano. I data center rappresentano circa lo 0,2% del consumo di acqua dolce negli Stati Uniti. Sembra enorme finché non lo si confronta con altre industrie. L’agricoltura rappresenta circa il 70% dei prelievi globali di acqua dolce. Un singolo campo da golf in Arizona utilizza più acqua all’anno di molti data center. La domanda non è se l’IA usi acqua; è se tale utilizzo sia proporzionato al suo valore e paragonabile alle alternative.

Confronti tra industrie

Si considerino queste proporzioni:

  • Produrre un chilogrammo di carne bovina richiede circa 15.000 litri di acqua a livello globale. Tuttavia, si tratta in gran parte di acqua “verde” alimentata dalle piogge; l’effettiva acqua “blu” (prelevata da fiumi e falde acquifere) è di circa 2.000 litri negli Stati Uniti, ancora una quantità enorme rispetto ai servizi digitali.
  • Produrre una singola maglietta di cotone utilizza circa 2.700 litri di acqua, in gran parte a causa degli elevati bisogni di irrigazione del cotone e dell’intensivo processo di tintura.
  • Una tipica fabbrica di semiconduttori consuma miliardi di litri all’anno.
  • Le centrali termoelettriche utilizzano molto più acqua di tutti i data center messi insieme.

I data center rappresentano ancora solo una piccola parte dell’utilizzo totale di acqua negli Stati Uniti. L’impronta dell’industria dell’IA, sebbene in crescita, rimane modesta rispetto a industrie consolidate che raramente affrontano un esame simile. Nessuno condivide post virali sull’impronta idrica del proprio caffè mattutino, eppure una singola tazza richiede circa 140 litri per essere prodotta se si tiene conto della coltivazione e della lavorazione dei chicchi.

Attività quotidiane

Le misurazioni di Google mettono le query dell’IA nella giusta prospettiva: un singolo prompt di testo utilizza un’energia equivalente a guardare la TV per meno di nove secondi. Lo streaming video, la gestione dei server di posta elettronica e la ricarica degli smartphone consumano tutti risorse. L’infrastruttura che supporta l’abitudine di Netflix o lo scorrere di Instagram utilizza sistemi di raffreddamento simili. Prendere di mira l’IA ignorando attività digitali comparabili crea un’immagine distorta dell’impatto ambientale della tecnologia.

Cosa stanno facendo realmente le aziende tecnologiche

La narrazione secondo cui le aziende tecnologiche ignorano le preoccupazioni ambientali non corrisponde alla realtà. I principali provider hanno investito pesantemente in miglioramenti dell’efficienza e fonti idriche alternative. Google ha ridotto le emissioni energetiche dei propri data center del 12% nel 2024, nonostante un aumento del 27% della domanda di elettricità. Microsoft si è impegnata a essere water positive entro il 2030. Potrebbero essere solo dichiarazioni di PR, ma spesso rappresentano miliardi di investimenti in infrastrutture.

L’industria ha forti incentivi finanziari per ridurre i consumi. I costi di acqua ed energia incidono direttamente sui margini, rendendo i miglioramenti dell’efficienza redditizi anziché puramente altruistici.

Fonti idriche non potabili

Molti data center moderni utilizzano acque reflue riciclate, acque grigie trattate o acqua di mare per il raffreddamento, piuttosto che competere con le forniture idriche comunali potabili. Le decisioni sulla localizzazione danno sempre più priorità a regioni con acqua abbondante e reti di energia pulita. I ricercatori della Cornell hanno scoperto che un posizionamento intelligente combinato con l’efficienza operativa potrebbe ridurre l’impatto idrico dell’IA dell’86% rispetto agli scenari peggiori. Il Midwest e gli stati della “cintura del vento” offrono i migliori profili combinati di carbonio e acqua per le nuove strutture.

Miglioramenti dell’efficienza

I data center di Google ora utilizzano l’84% in meno di energia overhead rispetto alla media del settore. In un recente periodo di 12 mesi, l’impronta energetica e di carbonio dei prompt di testo mediani di Gemini è diminuita rispettivamente di 33 e 44 volte. Le metriche di Water Usage Effectiveness sono migliorate costantemente in tutto il settore. Questi guadagni si cumulano: modelli più efficienti eseguiti su hardware più efficienti in strutture più efficienti riducono drasticamente l’utilizzo di risorse per query.

La vera conversazione sulla sostenibilità

Sminuire tutte le preoccupazioni ambientali sull’IA sarebbe fuorviante tanto quanto accettare acriticamente le statistiche virali. L’industria affronta sfide genuine, in particolare per quanto riguarda la rapida espansione in regioni sottoposte a stress idrico. Più di 160 nuovi data center per l’IA sono apparsi negli Stati Uniti negli ultimi tre anni, alcuni in aree già colpite dalla siccità. La domanda non è se l’IA abbia un impatto ambientale; è se tale impatto sia gestito in modo responsabile e proporzionato ai benefici forniti.

Preoccupazioni legittime contro panico

Le critiche valide includono la mancanza di trasparenza da parte dei provider, l’accentramento delle strutture in regioni già sotto stress e una supervisione normativa insufficiente sui diritti idrici. Ciò che è esagerato: le affermazioni che l’IA sia unicamente distruttiva rispetto ad altri servizi digitali, o che le singole query rappresentino un danno ambientale significativo. Quando si valutano servizi di IA che non si addestrano sui tuoi dati, l’impronta ambientale merita considerazione insieme alla privacy, ma le statistiche guidate dal panico non aiutano nessuno a prendere decisioni informate.

Domande migliori da porsi

Invece di chiedersi “quanta acqua usa l’IA?”, bisognerebbe chiedersi: Dove si trova questo data center e qual è la situazione idrica locale? Quale tecnologia di raffreddamento utilizza? Qual è la fonte di energia? Il provider pubblica metriche ambientali verificate? Queste domande producono informazioni su cui si può agire. Esigere trasparenza e supportare i provider che dimostrano genuini miglioramenti dell’efficienza crea incentivi migliori rispetto alla condivisione di statistiche fuorvianti.

Un’alternativa a minor impatto: IA Open Source

La scelta del modello influisce sull’impronta ambientale più di quanto la maggior parte degli utenti realizzi. I modelli di ragionamento come o3 e DeepSeek-R1 superano i 29 Wh per prompt lungo, oltre 65 volte il consumo dei modelli più piccoli. Scegliere modelli di dimensioni adeguate alle proprie esigenze reali riduce il consumo di risorse senza sacrificare l’utilità. I modelli open source spesso girano su infrastrutture più distribuite ed efficienti rispetto ai massicci sistemi proprietari.

Perché i modelli Open Source usano meno acqua

Le recenti innovazioni nell’IA open source hanno migliorato drasticamente l’efficienza attraverso architetture come il Mixture-of-Experts (MoE). Invece di eseguire l’intero modello per ogni parola, questi modelli attivano solo una piccola frazione della loro rete. Ad esempio, il recente modello open source MiniMax M2.5 ha 230 miliardi di parametri, ma ne attiva solo circa 10 miliardi (4,3%) durante l’inferenza. Allo stesso modo, GLM-5 contiene 744 miliardi di parametri ma ne attiva solo 40 miliardi.

Ciò significa che l’esecuzione di questi modelli open source altamente capaci richiede molta meno potenza di calcolo, energia e, in ultima analisi, acqua di raffreddamento rispetto ai massicci modelli densi che attivano centinaia di miliardi di parametri per ogni singolo token. Comprendere le opzioni di IA conformi al GDPR porta spesso a scoprire queste alternative altamente efficienti che offrono risultati aziendali equivalenti con una frazione dell’impronta delle risorse.

Prova DentroChat: l’opzione IA sostenibile europea

I data center europei operano tipicamente in climi più freschi con reti energetiche più pulite, riducendo sia l’impronta idrica che quella di carbonio. Ad esempio, i principali operatori di data center nordici come atNorth riportano un Water Usage Effectiveness (WUE) di soli 0,1 litri per kWh. Molto inferiore alla media del settore di 1,8 L/kWh. Inoltre, le strutture in Finlandia, Islanda e Svezia riciclano attivamente il calore dei server per il teleriscaldamento e la produzione alimentare anziché evaporare acqua.

DentroChat esegue modelli open source su infrastrutture europee, offrendo un’alternativa a minor impatto rispetto a GPT o Claude per gli utenti che si preoccupano della sostenibilità oltre che della privacy. La combinazione di modelli efficienti, posizioni favorevoli e operazioni trasparenti rappresenta l’aspetto che può avere una distribuzione responsabile dell’IA.