Consumo de agua en IA: consultas de texto, imágenes generativas y animación tradicional, mito o realidad.


La huella hídrica implicada en las manifestaciones tecnológicas de la creatividad presenta importantes variaciones entre los diversos procesos que se analizan en este capítulo, es cierto, entre realizar una consulta a un lenguaje modelo, generar una imagen con IA o producir una animación de forma tradicional.

Las consultas a modelos de lenguaje como ChatGPT pueden aparentar ser "virtuales", pero se encuentran acompañadas de un consumo en la práctica de agua en los centros de datos habilitados para procesar tales peticiones. Las consultas a estos modelos de lenguaje pueden parecer "virtuales", pero van seguidas del consumo tangible de agua en aquellos centros de datos habilitados para desarrollar tal trabajo. En este caso, por dos causas principales: (a) agua utilizada en las plantas de energía que proporcionan electricidad a los sistemas de servidores (la mayoría de las plantas termoeléctricas utilizan agua para generar vapor y para refrigerar) y (b) agua utilizada directamente en los sistemas de refrigeración (ej. torres de refrigeración que evaporan agua en la tarea de refrigerar servidores).

Por el conjunto de estos procesos se puede decir que cada vez que formulamos una pregunta a ChatGPT se "evaporan" mililitros de agua dulce para alimentar y refrigerar los dispositivos que calculan la respuesta. 

Un estudio a partir de la Universidad de California en Riverside (2023) ha cuantificado por primera vez esta huella hídrica: se estima que entre unas 20 y 50 consultas a un chatbot como ChatGPT consumen sobre 0,5 litros de agua.  De ahí que cada pregunta por separado pueda llevarse entre 0,01 y 0,025 litros de agua de promedio (entre 10 y 25 mililitros).

Al ir al caso, una "conversación" completa de un usuario con ChatGPT (varias preguntas y respuestas) equivaldría a un vaso de agua, y otra estimación que publicaba el medio The Washington Post también apuntó un valor parecido: aprox. 0,5 litros por cada consulta larga; por ejemplo, un correo de 100 palabras generado con GPT-4 consume unos 519 ml de agua (entre la electricidad y el enfriamiento requeridos) MEDIUM.COM. Esta agua se pierde en formato de vapor principalmente, ya que sale de las torres de enfriamiento de las plantas eléctricas o de sus chimeneas.

Conviene puntualizar aquí que dichas cifras corresponden al uso (inferencia) del modelo. El entrenamiento de los modelos de lenguaje, que es un proceso singular pero intensísimo, cuenta con una huella hídrica muchísimo mayor. Por poner un ejemplo, el entrenamiento del modelo completo GPT-3 (antecesor de ChatGPT) supuso consumir aproximadamente 700.000 litros de agua en el datacenter de Microsoft.  Sin embargo, ese gasto de entrenamiento se "amortiza" sobre miles o millones de consultas que después responderá el modelo. En suma, para una sola consulta textual típica, hablamos de decenas de mililitros de agua consumida en los centros de datos (en enfriamiento y energía), un gasto que es bajo comparado con las tradicionales, pero no deja de ser importante dada la enorme escala de uso de estos modelos.

 Generación de una imagen con IA (estilo Studio Ghibli).

La producción de imágenes por AI (por ejemplo, elaborar una imagen estilo Studio Ghibli utilizando modelos generativos) también exige un consumo de agua, efectivamente por las mismas razones: electricidad consumida por las GPUs/TPUs que renderizan la imagen y la refrigeración de esos equipos en la nube. De un modo general, producir imágenes con un modelo de difusión o red generativa profunda exige un esfuerzo computacional más exigente que una consulta de texto, ya que se requiere un cálculo gráfico intensivo. Esto se traduce en un mayor consumo energético por imagen y, en consecuencia, en una huella hídrica relativamente mayor por unidad generada.

Una investigación llevada a cabo en el marco del proyecto Ecologías Híbridas determinó la huella hídrica del modelo generativo Stable Diffusion (un modelo de código abierto) en la producción de imágenes. Esta investigación determinó que la producción de una sola imagen a partir de este modelo requería de aproximadamente 0,032 litros de agua (32 ml) en el centro de datos analizado. La discusión sobre este cálculo que considera tanto al refrigerado de un servidor con GPU en el intervalo de tiempo en el que requiere la producción de la imagen (aproximadamente ~78 segundos), como a la electricidad que se consume. Es decir, cada imagen generada por IA “consumirá” á una cifra equivalente a decenas de ml de agua. El origen del consumo es el agua requerida para refrigerar la GPU y la necesaria para generar electricidad que va a ser usada.

Generación de texto vs. generación de imagen

Puede resultar interesante hacer una comparación de la cifra anterior con la de las consultas de texto: ~32 ml por imagen que se producen, mientras que de manera similar el coste de una consulta textual es de ~10-20 ml por consulta. La mayor cantidad de agua consumida por imagen en comparación con la generada a partir de una consulta textual puede explicarse a partir de la mayor cantidad de computación que requiere. Aun así, al igual que en el caso de los modelos de lenguaje, entrenar el modelo de IA en sí consume muchísima más agua que utilizarlo. Como ejemplo, la huella hídrica estimada para entrenar el modelo de Stable Diffusion (que incluye también la recopilación de datos y el entrenamiento propiamente dicho) fue de aproximadamente 132,440 litros de agua (132,44 m³).

Asumimos aquí el “agua virtual” en el sentido inverso para contar con un modelo que sea capaz de generar imágenes al estilo de Ghibli; pero, una vez entrenado el modelo, cada inferencia a la hora de generar una imagen añade tan solo ~0,03 L a dicho consumo, que puede ser añadido fácilmente en la lista del flujo de producción.   De esta forma, podríamos decir que una ilustración generada por IA consumiría del orden de 10–40 mililitros de agua, dependiendo de la complejidad del propio modelo y de su capacidad de ser ejecutado en el propio centro de datos, en el que su temperatura y humedad relativa son precisamente regulables para conseguir un suficiente confort en relación a la producción.  Aunque individualmente se trate de un valor bajo, el impacto multiplicador es claro, tanto en la imagen como en el texto, con miles de imágenes generadas en los servicios más populares.


Producción de una animación tradicional (estilo Studio Ghibli)

La elaboración de un largometraje animado de forma tradicional puede requerir entre 100 a 1.000.000 litros de agua en forma total. Esto es así principalmente debido a los materiales que intervienen (papel, por ejemplo, que en el caso de una hoja A4, puede requerir en torno a 10 l de agua de media) y, en menor medida, a la energía y los químicos que participan en el film. Por ejemplo, sólo los cientos de miles de hojas y acetatos de los que requiere un film de Studio Ghibli, por sí solo, pueden implicar entre uno y dos millones de litros de agua por la fabricación del papel y de acetatos​.

Referencias de consulta:

  • Danelski, D. (2023). “AI programs consume large volumes of scarce water.” News UCR – Univ. of California, Riverside​ NEWS.UCR.EDU.

  • M. Nawaz (2024). “Does AI drink water & consume electricity?” Medium. (Incluye datos de The Washington Post)​ MEDIUM.COM.

  • Ecologías híbridas (2023). “What is the Water Footprint of an image produced with Artificial Intelligence?” (Proyecto CHILE)​. 

  • Ghibli Wiki – Princess Mononoke (consultado 2023). Datos de cels/dibujos utilizados en películas de Studio Ghibli​. 

  • Environmental Paper Network (2018). “State of the Global Paper Industry Report.” (Citado por Paper on the Rocks)​.

  • Hoekstra et al. (2011). “The water footprint of paper products.” Water Footprint Network (Report 46)​.

Comentarios

Entradas populares de este blog

¿Modelo? ¿Enfoque? ¿Método? ¿Metodología? ¿Técnica? ¿Estrategia? ¿Recurso? ¿cuándo debemos emplear cada uno de estos términos?

30 plataformas de todo el mundo con cursos MOOC gratuitos