La inteligencia artificial (IA) es un campo en constante evolución. En los últimos años, la discusión sobre la IA open source ha cobrado fuerza, con voces diversas intentando definir lo que realmente significa. Ahora, en TC, han investigado sobre este tema en un impresionante artículo que aquí os resumo:
El Debate de la IA Open Source
Desde hace décadas, la comunidad tecnológica ha debatido intensamente sobre el software open source versus el propietario. Ahora, esta discusión se extiende al mundo de la IA. Stefano Maffulli, director ejecutivo de la Open Source Initiative (OSI), lidera los esfuerzos para clarificar qué constituye una IA open source.
Diferencias Fundamentales
Joseph Jacks, evangelista del open source, sostiene que no existe una «IA open source» como tal. La razón es simple: los pesos de redes neuronales (NNWs, por sus siglas en inglés) no son comparables al código fuente del software. Estos pesos son parámetros que la red aprende durante el entrenamiento y no son legibles ni depurables por humanos.
El Caso de Meta
Un ejemplo notable es Meta y sus modelos de lenguaje Llama. Meta ha promocionado estos modelos como open source, pero con restricciones significativas. Los desarrolladores con aplicaciones que tienen más de 700 millones de usuarios mensuales necesitan una licencia especial de Meta, lo cual limita la verdadera apertura del modelo.
La Iniciativa de la OSI
La OSI ha estado trabajando durante más de 25 años definiendo lo que es el software open source. Ahora, enfrentan el reto de aplicar estos principios a la IA. La organización ha desarrollado una definición preliminar que incluye un preámbulo, la definición en sí y una lista de verificación para asegurar el cumplimiento.
Componentes de la Definición
La definición actual de la OSI para la IA open source abarca tres libertades esenciales:
- Uso sin restricciones: Utilizar el sistema para cualquier propósito sin necesidad de permisos.
- Estudio y análisis: Permitir que otros estudien el funcionamiento del sistema y examinen sus componentes.
- Modificación y distribución: Modificar y compartir el sistema para cualquier propósito.
Datos y Reproducibilidad
Uno de los mayores desafíos es la gestión de los datos utilizados para entrenar los modelos de IA. La OSI sugiere que la transparencia sobre el origen de los datos y el proceso de etiquetado es más importante que el acceso a los datos en bruto. Esto es crucial para entender y reproducir los modelos de manera efectiva.
Perspectivas Futuras
La definición de IA open source no será estática. La tecnología avanza rápidamente, y la OSI se prepara para adaptar su definición según sea necesario. Se espera que la versión estable de la definición se lance en octubre, después de una serie de consultas globales.
Adaptación y Evolución
La definición no se llamará «versión final» porque se anticipan cambios. Maffulli destaca que mientras algunos elementos fundamentales como «qué es un sistema de IA» podrían permanecer constantes, los detalles técnicos en la lista de verificación probablemente evolucionen con la tecnología.
Papel de la OSI en el Futuro
El objetivo de la OSI es establecer una guía robusta y flexible que ayude a la comunidad a desarrollar y desplegar sistemas de IA verdaderamente open source. Este esfuerzo incluye asegurarse de que la definición sea replicable y transparente, con claras instrucciones para la reproducción de modelos.
La discusión sobre lo que constituye una IA open source es compleja y multifacética. La OSI, con su enfoque colaborativo y global, está en el camino de proporcionar una claridad muy necesaria en este ámbito. La comunidad tecnológica debe estar preparada para adaptarse y evolucionar junto con estas definiciones.