El aprendizaje automático se ha convertido en una herramienta esencial en la era digital, permitiendo avances significativos en áreas como la salud, el transporte y la energía. Sin embargo, este progreso tecnológico también tiene un impacto ambiental importante. Un estudio reciente, realizado por un equipo de investigadores de la Universidad de California y de la Universidad de Purdue, se centró en evaluar el consumo de agua de los modelos de inteligencia artificial (IA).
El estudio es el primero de su tipo en analizar la huella hídrica de los modelos de IA. En lugar de centrarse en el agua utilizada para fabricar servidores y unidades de procesamiento gráfico (GPU), los investigadores se enfocaron en la huella hídrica operativa de los modelos de IA, es decir, la cantidad de agua utilizada directa e indirectamente durante el entrenamiento y la inferencia de los modelos de IA.
¿Cuánta agua se utiliza para entrenar y utilizar modelos de IA?
El estudio reveló que el entrenamiento de un solo modelo de IA, como GPT-3, en los servidores de Microsoft, puede consumir hasta 700,000 litros de agua limpia. El entrenamiento de un modelo de IA similar en otra parte del mundo puede consumir hasta 4,9 millones de litros de agua.
En cuanto a la inferencia de los modelos de IA, se estima que ChatGPT, un modelo de conversación desarrollado por OpenAI, consume una botella de 500 ml de agua por cada conversación de 20 a 50 preguntas y respuestas, dependiendo del momento y el lugar en que se utilice. A pesar de que una botella de 500 ml puede parecer una cantidad insignificante, el consumo total de agua de la inferencia de los modelos de IA sigue siendo muy grande, dada la cantidad de usuarios que utilizan estos servicios.
El impacto del agua utilizada en los centros de datos
La mayor parte del consumo de agua asociado con el entrenamiento y la inferencia de modelos de IA proviene del uso de energía en los centros de datos. Los centros de datos utilizan grandes cantidades de agua para enfriar los servidores y las unidades de procesamiento gráfico que se utilizan para entrenar y utilizar los modelos de IA. Aunque existen soluciones de enfriamiento más eficientes, como los economizadores de aire exterior, la mayoría de los centros de datos aún dependen de sistemas de torres de enfriamiento, que consumen grandes cantidades de agua.
Además del consumo directo de agua en los centros de datos, la generación de electricidad utilizada por los centros de datos también tiene un impacto significativo en el consumo de agua. La generación de electricidad consume grandes cantidades de agua, lo que resulta en un consumo indirecto de agua para los centros de datos.
Para evitar el sobrecalentamiento de los servidores, se requiere una gran cantidad de energía para mantener una temperatura adecuada. Esto se logra mediante el uso de torres de enfriamiento, que son la solución de enfriamiento más común en los centros de datos. Sin embargo, estas torres consumen una gran cantidad de agua, lo que contribuye significativamente a la huella hídrica de los centros de datos.
Además del agua directa utilizada para el enfriamiento, también se requiere una gran cantidad de agua indirecta para la generación de electricidad utilizada en los centros de datos. Diferentes tipos de plantas de energía tienen diferentes intensidades de uso de agua y, en general, la producción de energía no renovable consume grandes cantidades de agua. Por lo tanto, los centros de datos que dependen de energía no renovable también tienen una gran huella hídrica indirecta.
La necesidad de aumentar la transparencia en la huella hídrica de la IA
El estudio señala la necesidad de aumentar la transparencia en torno a la huella hídrica de los modelos de IA y los centros de datos en general. Los desarrolladores de modelos de IA y los operadores de centros de datos deben proporcionar información detallada sobre la eficiencia de agua en tiempo real de sus modelos y centros de datos, incluyendo el uso de agua directa e indirecta. Esto permitiría a los usuarios tomar decisiones informadas sobre cuándo y cómo utilizar estos modelos de manera más sostenible.
El estudio sugiere que la industria de la IA debe considerar la ubicación geográfica al decidir dónde entrenar y desplegar modelos de IA. Las ubicaciones con mejores eficiencias de agua en tiempo real pueden reducir significativamente la huella hídrica de los modelos de IA. Por lo tanto, se necesitan enfoques más holísticos para abordar la huella hídrica de la IA y reducir tanto la huella de carbono como la huella hídrica.
La IA se ha convertido en una parte integral de la vida moderna, pero su huella hídrica ha sido en gran parte ignorada. El estudio muestra que la huella hídrica de la IA es significativa y que se necesita una mayor transparencia y un enfoque más holístico para abordar el problema. A medida que avanzamos hacia un futuro más sostenible, es importante que consideremos no solo la huella de carbono de la IA, sino también su huella hídrica.