Quanta água a IA utiliza?

Quanta água a IA utiliza?

Aposto que você já ouviu de tudo, desde "a IA consome uma garrafa de água a cada poucas perguntas" até "são basicamente algumas gotas". A verdade é mais complexa. O consumo de água da IA ​​varia bastante dependendo de onde ela é executada, da duração da pergunta e de como um data center resfria seus servidores. Então, sim, o número divulgado existe, mas está envolto em uma série de ressalvas.

A seguir, apresento números claros e objetivos, explico por que as estimativas divergem e mostro como construtores e usuários comuns podem reduzir o consumo de água sem se tornarem monges da sustentabilidade.

Artigos que você pode gostar de ler depois deste:

🔗 O que é um conjunto de dados de IA?
Explica como os conjuntos de dados possibilitam o treinamento de aprendizado de máquina e o desenvolvimento de modelos.

🔗 Como a IA prevê tendências
Mostra como a IA analisa padrões para prever mudanças e resultados futuros.

🔗 Como medir o desempenho da IA
Apresenta as métricas essenciais para avaliar precisão, velocidade e confiabilidade.

🔗 Como conversar com IA
Orienta estratégias eficazes de estímulo para melhorar a clareza, os resultados e a consistência.


Quanta água a IA usa? Números rápidos que você pode usar na prática 📏

  • Por solicitação, o volume típico hoje varia de menos de um mililitro para uma solicitação de texto mediana em um sistema convencional, até dezenas de mililitros para uma resposta mais longa e que exige maior poder computacional em outro. Por exemplo, os relatórios de contabilidade de produção do Google indicam um volume mediano de aproximadamente 0,26 mL para uma solicitação de texto (incluindo toda a sobrecarga de processamento) [1]. A avaliação do ciclo de vida da Mistral estima o volume de uma resposta de assistente com 400 tokens em cerca de 45 mL (inferência marginal) [2]. O contexto e o modelo são muito importantes.

  • O treinamento de um modelo de escala de fronteira pode consumir milhões de litros , principalmente devido ao resfriamento e à água utilizada na geração de eletricidade. Uma análise acadêmica amplamente citada estimou cerca de 5,4 milhões de litros para treinar um modelo da classe GPT, incluindo cerca de 700.000 litros consumidos no local para resfriamento, e defendeu o uso de agendamento inteligente para reduzir a intensidade hídrica [3].

  • Os centros de dados em geral: os grandes locais consomem, centenas de milhares de galões por dia nos principais operadores, com picos mais elevados em alguns campus, dependendo do clima e do projeto [5].

Sejamos honestos: esses números parecem inconsistentes à primeira vista. E são mesmo. E há bons motivos para isso.

 

IA sedenta

Métricas de IA para uso da água ✅

Uma boa resposta para " Quanta água a IA usa?" deve atender a alguns critérios:

  1. Clareza de limites:
    Inclui apenas de resfriamento no local ou também externa usada pelas usinas para gerar eletricidade? As melhores práticas distinguem entre captação de água e consumo de água e os escopos 1-2-3, semelhantes à contabilização de carbono [3].

  2. Sensibilidade de localização
    A água por kWh varia de acordo com a região e a matriz da rede, portanto, o mesmo aviso pode ter impactos diferentes na água, dependendo de onde é servido - uma razão fundamental pela qual a literatura recomenda o agendamento com base no tempo e no local [3].

  3. Realismo da carga de trabalho
    : O número reflete as solicitações de produção medianas , incluindo capacidade ociosa e sobrecarga do centro de dados, ou apenas o acelerador no pico? O Google enfatiza a contabilização de todo o sistema (ociosidade, CPUs/DRAM e sobrecarga do centro de dados) para inferência, não apenas os cálculos da TPU [1].

  4. Tecnologia de resfriamento
    O resfriamento evaporativo, o resfriamento líquido de circuito fechado, o resfriamento a ar e as abordagens emergentes de resfriamento direto no chip alteram drasticamente a intensidade do consumo de água. A Microsoft está implementando projetos destinados a eliminar o uso de água de resfriamento para determinados sites de próxima geração [4].

  5. Horário do dia e estação
    O calor, a umidade e as condições da rede elétrica alteram a eficácia do uso da água na vida real; um estudo influente sugere agendar grandes trabalhos quando e onde a intensidade da água é menor [3].


Extração de água versus consumo de água, explicado 💡

  • Retirada = água extraída de rios, lagos ou aquíferos (parte dela é devolvida).

  • Consumo = água não devolvida porque evapora ou é incorporada em processos/produtos.

consomem principalmente por evaporação. A geração de eletricidade pode extrair grandes volumes (às vezes consumindo parte deles), dependendo da usina e do método de resfriamento. Um número de IA confiável rotula o que está relatando [3].


Para onde vai a água na IA: os três baldes 🪣

  1. Escopo 1 - resfriamento no local
    A parte visível: água evaporada no próprio centro de dados. Escolhas de projeto como evaporação versus ar ou líquido de circuito fechado estabelecem a base [5].

  2. Escopo 2 - geração de eletricidade
    Cada kWh pode conter uma etiqueta de água oculta; a mistura e a localização determinam o sinal de litros por kWh que sua carga de trabalho herda [3].

  3. Escopo 3 - cadeia de suprimentos
    A fabricação de chips depende de água ultrapura na fabricação. Você não verá isso em uma métrica “por solicitação”, a menos que o limite inclua explicitamente impactos incorporados (por exemplo, uma ACV completa) [2][3].


Fornecedores em números, com nuances 🧮

  • O Google Gemini solicita
    o método de serviço Full-stack (incluindo sobrecarga ociosa e de instalações). A solicitação de texto mediana ~0,26 mL de água juntamente com ~0,24 Wh de energia; os números refletem o tráfego de produção e limites abrangentes [1].

  • Mistral Large 2 ciclo de vida
    Uma rara LCA independente (com ADEME/Carbone 4) revela ~281.000 m³ para treinamento + uso inicial e uma margem de inferência de ~45 mL para uma resposta de assistente de 400 tokens

  • A ambição da Microsoft de resfriamento sem água
    Os data centers de próxima geração são projetados para consumir zero água para resfriamento , dependendo de abordagens diretas ao chip; os usos administrativos ainda exigem alguma água [4].

  • Escala geral do centro de dados
    Os principais operadores relatam publicamente centenas de milhares de galões por dia em média em locais individuais; o clima e o projeto influenciam os números para cima ou para baixo [5].

  • seminal
    de “IA sedenta” estimou milhões de litros para treinar modelos da classe GPT e que 10 a 50 respostas médias poderiam equivaler aproximadamente a uma de 500 mL - dependendo muito de quando/onde são executadas [3].


Por que as estimativas divergem tanto? 🤷

  • Limites diferentes.
    Algumas cifras consideram apenas o resfriamento no local ; outras incluem a água da eletricidade ; as ACVs podem incluir a fabricação de chips . Maçãs, laranjas e salada de frutas [2][3].

  • Diferentes cargas de trabalho
    Um pequeno prompt de texto não é uma longa execução multimodal/de código; o processamento em lote, a concorrência e as metas de latência alteram a utilização [1][2].

  • Climas e redes diferentes.
    O resfriamento evaporativo em uma região quente e árida é diferente do resfriamento ar/líquido em uma região fria e úmida. A intensidade da água na rede varia amplamente [3].

  • Metodologias de fornecedores
    : O Google publicou um método de distribuição para todo o sistema; a Mistral publicou uma ACV formal. Outros oferecem estimativas pontuais com métodos esparsos. Uma alegação de grande repercussão de "um décimo quinto de colher de chá" por solicitação ganhou as manchetes - mas sem detalhes de limites, não é comparável [1][3].

  • Um alvo móvel
    O resfriamento está evoluindo rapidamente. A Microsoft está testando o resfriamento sem água em determinados locais; a implementação reduzirá o consumo de água no local, mesmo que a eletricidade a montante ainda carregue um sinal de água [4].


O que você pode fazer hoje para reduzir a pegada hídrica da IA ​​🌱

  1. Dimensionar o modelo corretamente
    Modelos menores e ajustados à tarefa frequentemente atingem a precisão consumindo menos poder computacional. A avaliação de Mistral destaca fortes correlações entre tamanho e consumo de recursos - e publica números de inferência marginal para que você possa analisar as compensações [2].

  2. Escolha regiões com uso eficiente da água.
    Prefira regiões com climas mais frios, refrigeração eficiente e redes com menor intensidade de água por kWh; o trabalho “IA sedenta” mostra que com base no tempo e no local ajuda [3].

  3. Desloque as cargas de trabalho no tempo.
    Agende o treinamento/inferência em lote pesado para horários de uso eficiente da água (noites mais frias, condições de grade favoráveis) [3].

  4. Solicite ao seu fornecedor métricas transparentes sobre
    a demanda de água por solicitação , definições de limites e se os números incluem capacidade ociosa e custos indiretos da instalação. Grupos de políticas estão pressionando pela divulgação obrigatória para possibilitar comparações justas [3].

  5. A tecnologia de resfriamento é importante.
    Se você usa hardware, avalie o resfriamento de circuito fechado/direto ao chip ; se você está na nuvem, prefira regiões/provedores que investem em projetos com baixo consumo de água [4][5].

  6. Utilização de águas cinzas e opções de reutilização
    Muitos campi podem substituir fontes não potáveis ​​ou reciclar dentro de circuitos; grandes operadores descrevem o equilíbrio das fontes de água e das escolhas de resfriamento para minimizar o impacto líquido [5].

Um exemplo rápido para tornar isso real (não é uma regra universal): transferir um trabalho de treinamento noturno de uma região quente e seca no meio do verão para uma região mais fria e úmida na primavera - e realizá-lo durante horários mais frescos e fora do pico - pode alterar tanto o uso de água no local fora do local (da rede). Esse é o tipo de ganho prático e sem grandes problemas que o planejamento pode proporcionar [3].


Tabela comparativa: dicas rápidas para reduzir o impacto da IA ​​na água 🧰

ferramenta público preço Por que funciona?
Modelos menores e ajustados à tarefa Equipes de aprendizado de máquina, líderes de produto Baixo-médio Menos computação por token = menos refrigeração + eletricidade e água; comprovado em relatórios no estilo LCA [2].
Seleção de região por consumo de água/kWh Arquitetos de nuvem, compras Médio Mudança para climas mais frios e redes com menor intensidade hídrica; combinar com roteamento consciente da demanda [3].
Janelas de treinamento por horário MLOps, agendadores Baixo Noites mais frias + melhores condições da rede reduzem a intensidade efetiva da água [3].
Resfriamento direto no chip/circuito fechado Operações de data center Médio-alto Evita torres evaporativas sempre que possível, reduzindo drasticamente o consumo no local [4].
Duração do aviso e controles de lote Desenvolvedores de aplicativos Baixo Limitar tokens descontrolados, agrupar de forma inteligente, armazenar resultados em cache; menos milissegundos, menos mililitros [1][2].
Lista de verificação de transparência do fornecedor Diretores de tecnologia (CTOs), líderes de sustentabilidade Livre Força a clareza dos limites (no local vs. fora do local) e a comparação direta de relatórios [3].
Águas cinzas ou fontes reutilizadas Instalações, municípios Médio A substituição de água não potável alivia a pressão sobre os abastecimentos de água potável [5].
Parcerias para reutilização de calor Operadores, conselhos locais Médio Uma melhor eficiência térmica reduz indiretamente a procura de refrigeração e gera boa vontade local [5].

(O termo “preço” é propositalmente indefinido – as implementações variam.)


Análise detalhada: o clamor político está ficando cada vez mais alto 🥁

Entidades de engenharia defendem a divulgação obrigatória do consumo de energia e água dos centros de dados para que compradores e comunidades possam avaliar custos e benefícios. As recomendações incluem definições de escopo, relatórios por local e orientações de localização – porque sem métricas comparáveis ​​e que levem em consideração a localização, estamos discutindo no escuro [3].


Análise detalhada: nem todos os data centers funcionam da mesma maneira 🚰

Existe um mito persistente de que “o resfriamento a ar não usa água”. Não é bem assim. Sistemas que utilizam muito ar geralmente requerem mais eletricidade , que em muitas regiões carrega água escondida da rede; por outro lado, o resfriamento a água pode reduzir o consumo de energia e as emissões, ao custo de água no local. Grandes operadores equilibram explicitamente essas compensações caso a caso [1][5].


Análise aprofundada: uma rápida verificação da realidade sobre alegações virais 🧪

Você pode ter visto afirmações ousadas de que um único estímulo equivale a “uma garrafa de água” ou, no outro extremo, “apenas algumas gotas”. Melhor postura: humildade com a matemática . Os limites aceitáveis ​​de hoje são ~0,26 mL para um estímulo de produção mediano com sobrecarga total de serviço [1] e ~45 mL para uma resposta de assistente de 400 tokens (inferência marginal) [2]. A afirmação muito compartilhada de “um décimo quinto de uma colher de chá” carece de um limite/método público; trate-a como uma previsão do tempo sem a cidade [1][3].


Mini-FAQ: Quanta água a IA usa? Novamente, em linguagem simples 🗣️

  • Então, o que devo dizer em uma reunião?
    “Conforme solicitado, varia de gotas a alguns goles , dependendo do modelo, duração e local. O treinamento exige piscinas , não poças.” Em seguida, cite um ou dois exemplos acima.

  • A IA é excepcionalmente ruim?
    Ela é excepcionalmente concentrada : chips de alta potência agrupados criam grandes cargas de resfriamento. Mas os data centers também são onde a melhor tecnologia de eficiência tende a chegar primeiro [1][4].

  • E se simplesmente mudássemos tudo para resfriamento a ar?
    Você poderia reduzir o no local , mas aumentar o consumo fora do local por meio de eletricidade. Operadores sofisticados avaliam ambos [1][5].

  • E quanto à tecnologia futura?
    Projetos que evitem o resfriamento de água em grande escala seriam um divisor de águas para o Escopo 1. Alguns operadores estão caminhando nessa direção; a eletricidade a montante ainda carrega um sinal de água até que as redes mudem [4].


Considerações finais - Muito longo, não li tudo 🌊

  • Por prompt: pense em submililitros a dezenas de mililitros , dependendo do modelo, comprimento do prompt e de onde ele é executado. O prompt mediano é de ~0,26 mL em uma pilha principal; ~45 mL para uma resposta de 400 tokens em outra [1][2].

  • Treinamento: milhões de litros para modelos de fronteira, tornando o planejamento, a localização e a tecnologia de resfriamento críticos [3].

  • O que fazer: dimensionar corretamente os modelos, escolher regiões com uso eficiente da água, transferir trabalhos pesados ​​para horários mais frescos, preferir fornecedores que apresentem projetos com uso eficiente da água e exigir limites transparentes [1][3][4][5].

Metáfora um pouco falha para finalizar: a IA é uma orquestra sedenta – a melodia é o poder computacional, mas a bateria é o resfriamento e a água da rede elétrica. Afine a banda e o público ainda ouvirá a música sem que os aspersores precisem ser acionados. 🎻💦


Referências

  1. Blog do Google Cloud - Quanta energia a IA do Google consome? Fizemos as contas (metodologia + ~0,26 mL de consumo médio por porção, custos indiretos de fabricação). Link
    (PDF do artigo técnico: Medindo o impacto ambiental da implementação de IA na escala do Google ). Link

  2. Mistral AI - Nossa contribuição para um padrão ambiental global para IA (ACV com ADEME/Carbone 4; ~281.000 m³ de treinamento + uso inicial; ~45 mL por resposta de 400 tokens Link

  3. Li et al. - Tornando a IA menos "sedenta": Revelando e abordando a pegada hídrica secreta dos modelos de IA (treinamento de milhões de litros , com base em tempo e local , retirada versus consumo). Link

  4. Microsoft - Os data centers de próxima geração não consomem água para refrigeração (designs de chip direto visando refrigeração sem água em determinados locais). Link

  5. Centros de dados do Google - Operação sustentável (compensações de resfriamento em cada local; relatórios e reutilização, incluindo água recuperada/cinza; ordens de grandeza do uso diário típico em cada local). Link

Encontre a IA mais recente na loja oficial do AI Assistant

Sobre nós

Voltar ao blog