Consommation d'eau de l'IA : pourquoi les chiffres viraux sont trompeurs

Tous les quelques mois, un nouveau titre affirme que poser une question à ChatGPT engloutit une bouteille d’eau. Les chiffres semblent alarmants et se propagent rapidement. Mais lorsqu’on examine la méthodologie derrière ces affirmations, le tableau devient considérablement plus flou. La consommation d’eau de l’IA est devenue un sujet brûlant dans les débats sur la durabilité, pourtant les statistiques virales qui circulent en ligne manquent souvent du contexte nécessaire pour comprendre ce qu’elles signifient réellement. La réalité est plus nuancée et, dans de nombreux cas, beaucoup moins dramatique que ne le suggèrent les critiques.

Les statistiques sur la consommation d’eau de l’IA qui circulent en ligne déforment souvent la réalité en confondant l’entraînement ponctuel des modèles avec les requêtes continues, et en appliquant universellement les scénarios de refroidissement les plus défavorables. Les mesures réelles de Google montrent qu’une invite textuelle typique utilise environ 0,26 millilitre d’eau, soit près de 2 000 fois moins que ce que suggèrent les affirmations virales. Bien que l’expansion des centres de données dans les régions stressées par l’eau mérite une attention particulière, l’empreinte de l’industrie reste faible par rapport à l’agriculture ou à l’industrie manufacturière, et les améliorations en matière d’efficacité continuent de réduire considérablement l’utilisation des ressources par requête.

Les affirmations virales sur l’IA et l’eau

Le chiffre le plus souvent cité suggère qu’une seule conversation avec ChatGPT (souvent définie comme 20 à 50 questions) utilise 500 ml d’eau. Ce chiffre provient d’une étude de 2023 qui estimait également que l’entraînement de GPT-3 dans les centres de données américains de Microsoft pourrait directement évaporer 700 000 litres d’eau douce propre. La statistique est techniquement exacte pour ce scénario spécifique, mais elle a été dépouillée de son contexte et appliquée à grande échelle à chaque interaction avec l’IA, quel que soit le modèle, l’emplacement ou l’infrastructure.

Ce qui a commencé comme une conclusion limitée sur l’entraînement d’un modèle spécifique dans des installations spécifiques est devenu une condamnation universelle de toute utilisation de l’IA. C’est un problème. L’entraînement se produit une fois, mais l’inférence se produit des milliards de fois. Les confondre produit des conclusions trompeuses.

Titres contre réalité

L’affirmation selon laquelle « une bouteille d’eau par requête » confond l’entraînement avec l’inférence, ignore les variations régionales dans les méthodes de refroidissement et suppose les pires scénarios. Les propres mesures de Google racontent une histoire différente : l’invite textuelle médiane de Gemini Apps consomme seulement 0,26 millilitre d’eau, soit environ cinq gouttes. C’est près de 2 000 fois moins que ce que suggèrent les affirmations ci-dessus.

L’écart entre ces chiffres révèle à quel point la méthodologie est importante. Une étude mesurant l’entraînement en Arizona pendant l’été produira des chiffres radicalement différents de ceux d’une étude mesurant l’inférence en Finlande pendant l’hiver.

Comment ces chiffres sont calculés

Les estimations les plus alarmistes reposent sur des méthodes d’attribution qui affectent toute l’utilisation d’eau des centres de données aux charges de travail de l’IA, même lorsque ces installations exécutent d’innombrables autres services. Elles utilisent souvent des chiffres de consommation de pointe provenant de systèmes de refroidissement gourmands en eau dans des climats chauds, puis appliquent ces chiffres à l’échelle mondiale. Les cadres de recherche tentant d’évaluer l’empreinte environnementale de l’IA reconnaissent un obstacle majeur : les fournisseurs d’IA commerciaux ne divulguent pas de données d’inférence spécifiques aux modèles, obligeant les chercheurs à faire des hypothèses qui peuvent gonfler considérablement les estimations.

Comment fonctionne réellement le refroidissement des centres de données

Comprendre la consommation d’eau de l’IA nécessite de comprendre comment les centres de données gèrent la chaleur. Les serveurs génèrent de la chaleur pendant le calcul, et cette chaleur doit être évacuée pour éviter les pannes d’équipement. La méthode choisie dépend fortement du climat, des ressources locales et des priorités d’efficacité. Une installation à Phoenix fonctionne très différemment de celle de Stockholm, pourtant les critiques les traitent souvent de manière identique lors du calcul de l’impact environnemental.

Les systèmes de refroidissement expliqués

Le refroidissement par air traditionnel utilise des ventilateurs et la climatisation, consommant relativement peu d’eau mais plus d’électricité. Le refroidissement par évaporation, de plus en plus populaire dans les grandes installations, échange de l’eau contre une efficacité énergétique en utilisant l’évaporation pour dissiper la chaleur. Les approches plus récentes, comme le refroidissement liquide par immersion, submergent l’équipement dans un fluide non conducteur, éliminant totalement l’utilisation d’eau.

Le choix dépend des conditions locales. Les entreprises implantent de plus en plus leurs installations là où le stress hydrique est le plus faible et où l’énergie renouvelable est abondante, ce qui rend les déclarations générales intrinsèquement trompeuses.

Prélèvement vs Consommation

Les critiques confondent souvent le prélèvement d’eau avec la consommation d’eau. Le prélèvement désigne l’eau prélevée d’une source ; la consommation désigne l’eau qui n’est pas restituée. De nombreux systèmes de refroidissement prélèvent de l’eau, l’utilisent et en restituent la majeure partie à la source. La distinction est d’une importance capitale : une installation peut prélever des millions de litres tout en n’en consommant réellement qu’une fraction. Lors de l’évaluation de solutions IA sécurisées pour les entreprises, comprendre cette différence permet de distinguer les préoccupations légitimes des statistiques gonflées.

Remise en contexte des chiffres de consommation d’eau de l’IA

Les chiffres sans contexte trompent. Les centres de données représentent environ 0,2 % de la consommation d’eau douce aux États-Unis. Cela semble énorme jusqu’à ce qu’on le compare à d’autres industries. L’agriculture représente environ 70 % des prélèvements mondiaux d’eau douce. Un seul parcours de golf en Arizona utilise plus d’eau annuellement que de nombreux centres de données. La question n’est pas de savoir si l’IA utilise de l’eau ; c’est de savoir si cette utilisation est proportionnelle à sa valeur et comparable aux alternatives.

Comparaisons industrielles

Considérez ces proportions :

La production d’un kilogramme de bœuf nécessite environ 15 000 litres d’eau à l’échelle mondiale. Cependant, il s’agit en grande partie d’eau « verte » alimentée par la pluie ; l’eau « bleue » réelle (prélevée dans les rivières et les nappes phréatiques) est d’environ 2 000 litres aux États-Unis, ce qui reste un montant massif comparé aux services numériques.
La fabrication d’un seul t-shirt en coton utilise environ 2 700 litres d’eau, en grande partie en raison des importants besoins en irrigation du coton et du processus de teinture intensif.
Une fonderie de semi-conducteurs typique consomme des milliards de litres par an.
Les centrales thermiques utilisent beaucoup plus d’eau que tous les centres de données réunis.

Les centres de données ne représentent encore qu’une petite part de l’utilisation totale de l’eau aux États-Unis. L’empreinte de l’industrie de l’IA, bien qu’en croissance, reste modeste par rapport aux industries établies qui font rarement l’objet d’un examen similaire. Personne ne partage de publications virales sur l’empreinte hydrique de son café du matin, pourtant une seule tasse nécessite environ 140 litres pour être produite si l’on prend en compte la culture et le traitement des grains.

Activités quotidiennes

Les mesures de Google remettent les requêtes d’IA en perspective : une seule invite textuelle utilise une énergie équivalente à celle de regarder la télévision pendant moins de neuf secondes. La diffusion de vidéos en continu, l’exécution de serveurs de messagerie et la recharge de smartphones consomment tous des ressources. L’infrastructure qui soutient votre habitude de Netflix ou votre défilement sur Instagram utilise des systèmes de refroidissement similaires. Cibler uniquement l’IA tout en ignorant les activités numériques comparables donne une image déformée de l’impact environnemental de la technologie.

Ce que font réellement les entreprises technologiques

Le récit selon lequel les entreprises technologiques ignorent les préoccupations environnementales ne correspond pas à la réalité. Les principaux fournisseurs ont investi massivement dans l’amélioration de l’efficacité et dans des sources d’eau alternatives. Google a réduit les émissions d’énergie de ses centres de données de 12 % en 2024 malgré une augmentation de 27 % de la demande d’électricité. Microsoft s’est engagé à être positif en eau d’ici 2030. Il pourrait s’agir de simples déclarations de relations publiques, mais elles représentent souvent des milliards d’investissements dans les infrastructures.

L’industrie dispose de solides incitations financières à réduire sa consommation. Les coûts de l’eau et de l’énergie ont un impact direct sur les marges, rendant les améliorations de l’efficacité rentables plutôt que purement altruistes.

Sources d’eau non potable

De nombreux centres de données modernes utilisent des eaux usées recyclées, des eaux grises traitées ou de l’eau de mer pour le refroidissement, plutôt que d’entrer en concurrence avec les approvisionnements en eau potable municipaux. Les décisions d’implantation privilégient de plus en plus les régions disposant de ressources en eau abondantes et de réseaux d’énergie propre. Des chercheurs de Cornell ont découvert qu’une implantation intelligente combinée à une efficacité opérationnelle pourrait réduire l’impact de l’IA sur l’eau de 86 % par rapport aux pires scénarios. Le Midwest et les États de la « ceinture du vent » offrent les meilleurs profils combinés carbone-eau pour les nouvelles installations.

Améliorations de l’efficacité

Les centres de données de Google utilisent désormais 84 % d’énergie de fonctionnement en moins que la moyenne de l’industrie. Sur une période récente de 12 mois, l’empreinte énergétique et carbone des invites textuelles médianes de Gemini a chuté de 33 et 44 fois respectivement. Les métriques d’efficacité de l’utilisation de l’eau se sont améliorées régulièrement dans toute l’industrie. Ces gains se cumulent : des modèles plus efficaces fonctionnant sur du matériel plus efficace dans des installations plus efficaces réduisent considérablement l’utilisation des ressources par requête.

La véritable conversation sur la durabilité

Rejeter toutes les préoccupations environnementales concernant l’IA serait aussi trompeur que d’accepter les statistiques virales sans esprit critique. L’industrie fait face à de véritables défis, en particulier concernant l’expansion rapide dans les régions stressées par l’eau. Plus de 160 nouveaux centres de données d’IA sont apparus à travers les États-Unis au cours des trois dernières années, dont certains dans des zones déjà confrontées à la sécheresse. La question n’est pas de savoir si l’IA a un impact environnemental ; c’est de savoir si cet impact est géré de manière responsable et proportionnelle aux avantages qu’il procure.

Préoccupations légitimes vs Panique

Les critiques valables incluent le manque de transparence des fournisseurs, le regroupement d’installations dans des régions déjà stressées et une surveillance réglementaire insuffisante des droits sur l’eau. Ce qui est exagéré : les affirmations selon lesquelles l’IA est destructrice de manière unique par rapport à d’autres services numériques, ou que les requêtes individuelles représentent un préjudice environnemental significatif. Lors de l’évaluation de services d’IA qui ne s’entraînent pas sur vos données, l’empreinte environnementale mérite d’être prise en compte au même titre que la confidentialité, mais les statistiques axées sur la panique n’aident personne à prendre des décisions éclairées.

De meilleures questions à poser

Au lieu de demander « combien d’eau l’IA utilise-t-elle ? », demandez : Où ce centre de données est-il situé, et quelle est la situation locale de l’eau ? Quelle technologie de refroidissement utilise-t-il ? Quelle est la source d’énergie ? Le fournisseur publie-t-il des métriques environnementales vérifiées ? Ces questions fournissent des informations exploitables. Exiger de la transparence et soutenir les fournisseurs qui font preuve d’améliorations réelles de l’efficacité crée de meilleures incitations que le partage de statistiques trompeuses.

Une alternative à moindre impact : l’IA Open Source

Le choix du modèle affecte l’empreinte environnementale plus que la plupart des utilisateurs ne le réalisent. Les modèles de raisonnement comme o3 et DeepSeek-R1 dépassent les 29 Wh par longue invite, soit plus de 65 fois la consommation des modèles plus petits. Choisir des modèles de taille appropriée pour vos besoins réels réduit la consommation de ressources sans sacrifier l’utilité. Les modèles open source fonctionnent souvent sur une infrastructure plus distribuée et plus efficace que les systèmes propriétaires massifs.

Pourquoi les modèles Open Source consomment moins d’eau

Les récentes innovations dans l’IA open source ont considérablement amélioré l’efficacité grâce à des architectures comme le Mixture-of-Experts (MoE). Au lieu d’exécuter l’intégralité du modèle pour chaque mot, ces modèles n’activent qu’une petite fraction de leur réseau. Par exemple, le récent modèle open source MiniMax M2.5 possède 230 milliards de paramètres, mais n’en active qu’environ 10 milliards (4,3 %) lors de l’inférence. De même, GLM-5 contient 744 milliards de paramètres mais n’en active que 40 milliards.

Cela signifie que l’exécution de ces modèles open source très performants nécessite beaucoup moins de puissance de calcul, d’énergie et, en fin de compte, d’eau de refroidissement que les modèles denses massifs qui activent des centaines de milliards de paramètres pour chaque jeton. Comprendre les options d’IA conformes au GDPR mène souvent à la découverte de ces alternatives très efficaces qui offrent des résultats commerciaux équivalents avec une fraction de l’empreinte en ressources.

Essayez DentroChat : l’option IA durable de l’Europe

Les centres de données européens fonctionnent généralement dans des climats plus frais avec des réseaux énergétiques plus propres, réduisant à la fois les empreintes carbone et hydrique. Par exemple, les principaux opérateurs de centres de données nordiques comme atNorth rapportent une efficacité d’utilisation de l’eau (WUE) de seulement 0,1 litre par kWh. Ce qui est bien inférieur à la moyenne de l’industrie de 1,8 L/kWh. De plus, les installations en Finlande, en Islande et en Suède recyclent activement la chaleur des serveurs pour le chauffage urbain et la production alimentaire plutôt que d’évaporer l’eau.

DentroChat exécute des modèles open source sur une infrastructure européenne, offrant une alternative à moindre impact à GPT ou Claude pour les utilisateurs qui se soucient de la durabilité autant que de la confidentialité. La combinaison de modèles efficaces, d’emplacements favorables et d’opérations transparentes représente ce à quoi peut ressembler un déploiement responsable de l’IA.