Meta afirma que su alternativa a GPT-3 es más ligera y eficiente

Publicado el

Meta AI

El pasado viernes, Meta, la compañía detrás de Facebook, anunció su nuevo modelo de lenguaje grande (LLM) basado en IA llamado LLaMA-13B, sobre el que aseguran que puede superar al modelo GPT-3 de su rival OpenAI «en la mayoría de los puntos de referencia».

GPT-3 es el modelo de lenguaje detrás del chatbot de inteligencia artificial ChatGPT, por lo que si estas afirmaciones son ciertas, un modelo de tamaño reducido podría funcionar en entornos independientes, como computadoras portátiles individuales o incluso teléfonos inteligentes.

LLaMA, el modelo de lenguaje basado en IA presentado por Meta

La familia LLaMA viene en varias variedades que difieren en tamaño. El modelo de lenguaje más pequeño de esta familia contiene 7 mil millones de parámetros, mientras que la variante más compleja contiene 65 mil millones de parámetros. A modo de comparación, el GPT-3 de OpenAI se construye utilizando 175 mil millones de parámetros.

Meta también anunció que sus modelos LLaMA se entrenaron utilizando conjuntos de datos disponibles públicamente, incluidos Common Crawl, Wikipedia y C4. Por lo tanto, también lanzaron los pesos del modelo para todas las versiones de LLaMA-13B como código abierto. Según Guillaume Lample, miembro del proyecto LLaMA-13B en Meta, «a diferencia de Chinchilla, PaLM o GPT-3, solo usamos conjuntos de datos disponibles públicamente, lo que hace que nuestro trabajo sea compatible con código abierto y reproducible, mientras que la mayoría de los modelos existentes se basan en datos que no están disponibles públicamente o no están documentados».

LLaMA no se encuentra exenta de los reparos que en general han despertado estos modelos de lenguaje, que tienen la capacidad de generar contenido falso o engañoso a una escala nunca antes vista, lo que podría ser utilizado para engañar a los usuarios o difundir desinformación. Para evaluar este aspecto, habrá que esperar que llegue el momento en que esta herramienta pueda ser sometida a pruebas.

Para sortear los desafíos ligados a la fiabilidad de esta IA, es importante que los desarrolladores de esta tecnología trabajen en colaboración con los reguladores y los expertos en ética para garantizar que estos modelos de lenguaje se utilicen de manera responsable y no representen una amenaza para la seguridad y privacidad de los usuarios.

Esta noticia ha generado una gran emoción en la industria de la IA, ya que los modelos de lenguaje podrían ejecutarse en dispositivos móviles y computadoras portátiles, brindándoles una gran cantidad de capacidades nativas de un ChatGPT sustancialmente más grande. Los expertos de la industria también destacan que esta tecnología podría ser utilizada en aplicaciones como traducción en tiempo real, chatbots y asistentes virtuales.