Les grands modèles de langage populaires (LLM) comme ChatGPT d’OpenAI et Barde de Google consomment beaucoup d’énergie, nécessitant des fermes de serveurs massives pour fournir suffisamment de données pour former les programmes puissants. Le refroidissement de ces mêmes centres de données rend également les chatbots IA incroyablement assoiffés. De nouvelles recherches suggèrent une formation pour GPT-3 seul consommé 185 000 gallons (700 000 litres) d’eau. Selon la nouvelle étude, l’échange conversationnel d’un utilisateur moyen avec ChatGPT revient essentiellement à jeter une grande bouteille d’eau douce sur le sol. Étant donné le chatbot popularité sans précédentles chercheurs craignent que toutes ces bouteilles renversées n’aient un impact inquiétant sur l’approvisionnement en eau, en particulier au milieu sécheresses historiques et incertitude environnementale imminente aux Etats-Unis.
Des chercheurs de l’Université du Colorado Riverside et de l’Université du Texas à Arlington ont publié les estimations de la consommation d’eau de l’IA dans un article pré-imprimé intitulé « Rendre l’IA moins assoiffée.‘ » Les auteurs ont trouvé que la quantité d’eau douce claire nécessaire pour former GPT-3 est équivalente à la quantité nécessaire pour remplir la tour de refroidissement d’un réacteur nucléaire. OpenAI n’a pas révélé la durée de temps requis former GPT-3, compliquant les estimations des chercheursmais Microsoft, qui a conclu un partenariat pluriannuel de plusieurs milliards de dollars avec la startup AI et construit superordinateurs pour la formation à l’IAdit que son dernier supercalculateur, qui nécessiterait un important appareil de refroidissement, contient 10 000 cartes graphiques et plus de 285 000 cœurs de processeur, donnant un aperçu de la vaste échelle du opération derrière l’intelligence artificielle. Ce grand nombre de gallons pourrait produire des cellules de batterie pour 320 Teslas, ou, en d’autres termes, ChatGPT, qui est venu après GPT-3, aurait besoin de «boire» une bouteille d’eau de 500 millilitres afin de compléter un échange de base avec un utilisateur composé d’environ 25 à 50 questions.
Le nombre gargantuesque de gallons nécessaires pour former le modèle d’IA suppose également que la formation se déroule dans le centre de données américain de pointe de Microsoft, construit spécialement pour OpenAI à hauteur de dizaines de millions. Si les données étaient formées dans le centre de données asiatique moins économe en énergie de l’entreprise, le rapport note que la consommation d’eau pourrait être trois fois plus élevée. Les chercheurs s’attendent à ce que ces besoins en eau ne fassent qu’augmenter avec les nouveaux modèles, comme le GPT-4 récemment publiéqui reposent sur un ensemble de paramètres de données plus large que leurs prédécesseurs.
« L’empreinte hydrique des modèles d’IA ne peut plus rester sous le radar », ont déclaré les chercheurs. « L’empreinte eau doit être traitée en priorité dans le cadre des efforts collectifs pour lutter contre les défis mondiaux de l’eau. »
Comment les chatbots utilisent-ils l’eau ?
Lors du calcul de la consommation d’eau d’AI, les chercheurs établissent une distinction entre le « prélèvement » et la « consommation » d’eau. Le premier exemple est la pratique consistant à retirer physiquement l’eau d’une rivière, d’un lac ou d’une autre source, tandis que la consommation fait spécifiquement référence à la perte d’eau par évaporation lorsqu’elle est utilisée dans les centres de données. La recherche sur l’utilisation de l’eau par AI se concentre principalement sur la partie consommation de cette équation, où l’eau ne peut pas être recyclée.
Quiconque a passé quelques secondes dans une salle de serveurs d’entreprise sait que vous devez d’abord emporter un pull. Les salles de serveurs sont maintenues au frais, généralement entre 50 et 80 degrés Fahrenheit pour éviter tout dysfonctionnement de l’équipement. Maintenir cette température idéale est un défi constant car les serveurs convertissent eux-mêmes leur énergie électrique en chaleur. Les tours de refroidissement comme celles illustrées ci-dessous sont souvent déployées pour essayer de contrer cette chaleur et de maintenir les pièces à leur température idéale en évaporant l’eau froide.
Les tours de refroidissement font le travail, mais elles nécessitent d’immenses quantités d’eau pour le faire. Les chercheurs estiment qu’environ un gallon d’eau est consommé pour chaque kilowattheure dépensé dans un centre de données moyen. Il n’est pas non plus possible d’utiliser n’importe quel type d’eau. Les centres de données puisent dans des sources d’eau douce propres afin d’éviter la corrosion ou la croissance de bactéries qui peuvent accompagner l’eau de mer. L’eau douce est également essentielle pour le contrôle de l’humidité dans les pièces. Les chercheurs tiennent également les centres de données responsables de l’eau nécessaire pour générer les grandes quantités d’électricité qu’ils consomment, ce que les scientifiques ont appelé « la consommation d’eau indirecte hors site ».
Images du centre de données Google
Les problèmes de consommation d’eau ne se limitent pas aux modèles OpenAI ou AI. En 2019, Google a demandé plus de 2,3 milliards de gallons d’eau pour les centres de données dans seulement trois États. L’entreprise compte actuellement 14 centres de données répartis dans toute l’Amérique du Nord, qu’il utilise pour alimenter la recherche Google, sa suite de produits pour le lieu de travail et, plus récemment, son LaMDa et Barde grands modèles de langage. LaMDA à elle seule, selon le récent document de recherche, pourrait nécessiter des millions de litres d’eau pour s’entraîner, plus que GPT-3, car plusieurs des centres de données assoiffés de Google sont hébergés dans des États chauds comme le Texas ; les chercheurs ont cependant émis une mise en garde avec cette estimation, la qualifiant de «point de référence approximatif».
Outre l’eau, les nouveaux LLM nécessitent également une quantité stupéfiante d’électricité. Un rapport de Stanford AI publié la semaine dernière examinant différences de consommation d’énergie entre quatre modèles d’IA importants, Estimation Lancement du GPT-3 d’OpenAI 502 tonnes de carbone lors de sa formation. Dans l’ensemble, l’énergie nécessaire pour former GPT-3 pourrait alimenter la maison d’un Américain moyen pendant des centaines d’années.
« La course aux centres de données pour suivre tout cela est assez effrénée », a déclaré Kevin Kent, PDG de Critical Facilities Efficiency Solution. entretien avec le temps. « Ils ne peuvent pas toujours faire les choix les plus respectueux de l’environnement. »
Le changement climatique et l’aggravation des sécheresses pourraient amplifier les inquiétudes concernant l’utilisation de l’eau par l’IA
Déjà, le Forum économique mondial estimations quelque 2,2 millions d’habitants des États-Unis manquent d’eau et de plomberie intérieure de base. 44 millions de plus vivent avec des systèmes d’approvisionnement en eau « inadéquats ». Les chercheurs craignent qu’une combinaison de changement climatique et d’augmentation de la population américaine n’aggrave encore ces chiffres d’ici la fin du siècle. En 2071, Stanford estimations près de la moitié des 204 bassins d’eau douce du pays ne pourront pas répondre aux demandes mensuelles en eau. De nombreuses régions pourraient voir leurs approvisionnements en eau réduits d’un tiers au cours des 50 prochaines années.
La hausse des températures partiellement alimentée par l’activité humaine a conduit l’Ouest américain à enregistrer son la pire sécheresse en 1 000 ans qui menace également l’eau douce, bien que les pluies torrentielles récentes aient contribué à dissiper de graves inquiétudes. Oniveaux d’eau dans des réservoirs comme Lake Mead ont reculé si loin qu’ils ont exposés des restes humains vieux de plusieurs décennies. Tout cela signifie que les fortes demandes en eau de l’IA deviendront probablement un point de discorde croissant, surtout si la technologie est intégrée dans de plus en plus de secteurs et de services. Données les exigences pour les LLM ne font qu’augmenter, ce qui signifie que les entreprises devront trouver des moyens d’augmenter l’efficacité de l’eau de leurs centres de données.
Les chercheurs disent qu’il existe des moyens relativement clairs de faire baisser le prix de l’eau d’IA. Pour commencer, où et quand les modèles d’IA sont formés sont importants. Les températures extérieures, par exemple, peuvent affecter la quantité d’eau nécessaire pour refroidir centres de données. Les entreprises d’IA pourraient hypothétiquement former des modèles à minuit quand il fait plus frais ou dans un centre de données avec une meilleure efficacité de l’eau pour réduire la consommation d’eau, elles ont raison. Les utilisateurs de chatbot, d’autre part, pourraient choisir de s’engager avec les modules pendant « l’eau-horaires efficaces,» tout comme les autorités municipales encouragent l’utilisation du lave-vaisselle en dehors des heures d’ouverture. Pourtant, aucune de ces demandes-les changements secondaires nécessiteront une plus grande transparence de la part des entreprises technologiques qui construisent ces modèles, ce qui, selon les chercheurs, est en pénurie inquiétante.
« Nous recommandons aux développeurs de modèles d’IA et aux opérateurs de centres de données d’être plus transparents », ont écrit les chercheurs. « Quand et où les modèles d’IA sont-ils formés ? Qu’en est-il des modèles d’IA formés et/ou déployés dans des centres de données de colocation tiers ou des clouds publics ? De telles informations seront d’une grande valeur pour la communauté des chercheurs et le grand public.
Vous voulez en savoir plus sur l’IA, les chatbots et l’avenir de l’apprentissage automatique ? Découvrez notre couverture complète de intelligence artificielleou parcourez nos guides pour Les meilleurs générateurs d’art AI gratuits et Tout ce que nous savons sur le ChatGPT d’OpenAI.



GIPHY App Key not set. Please check settings