StableLM: El modelo de lenguaje de código abierto de Stability AI

Publicado el

stability LM

Stability AI ha lanzado StableLM, su modelo de lenguaje de código abierto, que permitirá a los desarrolladores e investigadores inspeccionar, utilizar y adaptar los modelos base de StableLM para fines comerciales o de investigación. El modelo está disponible en una versión alfa de 3.000 millones y 7.000 millones de parámetros, con modelos más grandes de 15.000 millones a 65.000 millones de parámetros que llegarán más adelante.

StableLM es el siguiente paso en la misión de Stability AI de democratizar la tecnología de IA y hacerla accesible para todos.  Busca ofrecer una alternativa transparente, abierta y escalable a la IA propietaria como un modelo de lenguaje que puede generar texto y código, lo que lo convierte en una herramienta poderosa para muchas aplicaciones de IA. Está diseñado para ser pequeño y eficiente y, a pesar de su tamaño reducido, ofrece un alto rendimiento en tareas conversacionales y de codificación gracias a su conjunto de datos experimental de 1,5 billones de tokens.

Características de StableLM

StableLM (ya en Github) se ha diseñado para ser transparente, accesible y de apoyo para los usuarios. Al ser un modelo de código abierto, los desarrolladores pueden inspeccionar y adaptar el modelo a sus necesidades sin compartir sus datos sensibles o renunciar al control de sus capacidades de IA. Las características adicionales de StableLM incluyen:

Conjunto de datos experimental

StableLM se entrena en un conjunto de datos experimental construido sobre The Pile, pero tres veces más grande, con 1,5 billones de tokens de contenido. La riqueza de este conjunto de datos proporciona un alto rendimiento en tareas conversacionales y de codificación, lo que demuestra que los modelos pequeños y eficientes pueden ofrecer una alta calidad.

Modelos de investigación

Stability AI también está lanzando una serie de modelos de investigación que se han afinado mediante instrucciones. Estos modelos utilizarán una combinación de cinco conjuntos de datos de IA de código abierto para agentes de conversación. Estos modelos están destinados solo para fines de investigación y se liberan bajo una licencia CC BY-NC-SA 4.0 que no permite el uso comercial.

Accesibilidad

StableLM está diseñado para ser accesible para los usuarios y se ha creado para funcionar en dispositivos locales, lo que significa que los desarrolladores pueden construir aplicaciones independientes compatibles con hardware ampliamente disponible en lugar de depender de servicios propietarios de una o dos empresas. Esto ayuda a democratizar la tecnología de IA y a compartir sus beneficios económicos con una amplia comunidad de usuarios y desarrolladores.

Soporte

StableLM se ha construido para apoyar a los usuarios y no reemplazarlos. Se enfoca en la eficiencia, la especialización y el rendimiento práctico de la IA en lugar de la búsqueda de la inteligencia divina. Stability AI desarrolla herramientas que ayudan a las personas y empresas a utilizar la IA para desbloquear su creatividad, aumentar su productividad y abrir nuevas oportunidades económicas.