IBM ha decidido abrir el código de sus modelos de IA Granite, marcando un hito importante en el acceso a tecnologías avanzadas para uso comercial y de investigación. Vamos a desgranar este acontecimiento, explicando cómo esto podría cambiar las reglas del juego para los desarrolladores y empresas alrededor del mundo.
¿Qué son los modelos Granite de IBM?
Los modelos Granite son una serie de modelos de lenguaje grande (LLM por sus siglas en inglés), específicamente diseñados para tareas de programación y desarrollo de software. Estos modelos han sido entrenados con datos de código provenientes de más de 116 lenguajes de programación y están adaptados para manejar desde modernización de aplicaciones complejas hasta tareas en dispositivos con limitaciones de memoria.
Lo que realmente destaca de estos modelos es que IBM los ha liberado bajo la licencia Apache 2.0, lo que permite su uso tanto en investigaciones como en aplicaciones comerciales sin las restricciones que normalmente imponen otros gigantes tecnológicos.
Uno de los mayores desafíos al trabajar con modelos de IA de gran escala como los LLM es evitar infracciones de derechos de autor o problemas legales. IBM ha tomado medidas meticulosas para prevenir estos problemas al utilizar datos de entrenamiento provenientes de fuentes públicamente disponibles, como repositorios de código en GitHub y otros bancos de datos de código abierto. Esto no solo asegura la legalidad del uso de estos modelos, sino que también fomenta un entorno de innovación más abierto y colaborativo.
Aplicaciones prácticas de los modelos Granite
IBM no solo ha desarrollado estos modelos para experimentación; los ha puesto en práctica dentro de su propia suite de productos, como el IBM Watsonx Code Assistant. Estas herramientas utilizan los modelos Granite para asistir en la automatización de tareas de TI, la modernización de aplicaciones en lenguajes como COBOL, y la generación de pruebas unitarias, entre otras funciones.
Uno de los aspectos más revolucionarios de la liberación de los modelos Granite es cómo IBM, en colaboración con Red Hat, ha trabajado para hacer estos modelos accesibles a una audiencia más amplia. Herramientas como InstructLab y Ollama ofrecen plataformas donde incluso los desarrolladores con menos experiencia en ciencia de datos pueden empezar a utilizar modelos de LLM de manera efectiva y eficiente.
Estas iniciativas están diseñadas para bajar las barreras de entrada y permitir a más personas y empresas explorar y expandir sus capacidades de desarrollo de software mediante IA avanzada, sin necesidad de inversiones millonarias en hardware especializado o en adquisición de tecnologías de punta.