Google presenta Gemma, innovación abierta en Modelos de Lenguaje de Gran Escala

Publicado el

google gemma

El mundo de la IA no para ni un minuto. Aún estamos recupérandonos de las novedades de OpenAI con Sora, y ahora llega Google y presenta algo que supera a Llama 2 (de Meta).

Así es, Google ha lanzado Gemma, una innovadora familia de modelos de inteligencia artificial que se erige sobre el legado de los modelos Gemini. Esta nueva propuesta se distingue por ofrecer versiones Gemma 2B y Gemma 7B, ambas diseñadas para adaptarse a diferentes necesidades de investigación y desarrollo, ya sea en su forma preentrenada o ajustada según instrucciones específicas.

 

Lo que me parece particularmente llamativo es la facilidad de acceso que Google propone para Gemma. La plataforma ha habilitado el acceso gratuito mediante Kaggle y Colab, democratizando así el uso de tecnologías de punta. Para aquellos que se adentran por primera vez en Google Cloud, se les ofrece una bienvenida con 300 dólares en créditos, y para los investigadores con proyectos ambiciosos, existe la posibilidad de solicitar hasta 500,000 dólares en créditos para dar un impulso significativo a sus investigaciones.

Una de las características más destacadas de Gemma es su capacidad para superar a Llama 2 en pruebas de rendimiento como MMLU, HellaSwag y HumanEval. Este logro no es menor, ya que refleja el avance continuo en la comprensión y generación del lenguaje natural por parte de las máquinas, un campo que sigue expandiéndose y desafiando nuestros límites conocidos.

gemma vs llama
Comparando Gemma con Llama 2

Google no solo se enfoca en la potencia y accesibilidad de Gemma, sino también en la responsabilidad de su uso. La introducción de un Kit de Herramientas de IA Generativa Responsable junto con los modelos es un claro indicativo de su compromiso con el desarrollo ético de la tecnología. Este conjunto de herramientas busca orientar a los desarrolladores hacia la creación de aplicaciones de IA seguras, un aspecto crucial en un momento donde las implicaciones éticas de la IA están bajo constante escrutinio.

Gemma es notable por su capacidad de procesamiento de lenguaje natural, pero también por su compatibilidad con marcos de trabajo líderes como JAX, PyTorch y TensorFlow a través de Keras 3.0. Esto facilita su integración en diversos proyectos, desde pequeñas startups hasta grandes corporaciones. La optimización para rendir en una amplia gama de plataformas, incluyendo laptops, estaciones de trabajo, Google Cloud y especialmente en GPUs de NVIDIA y TPUs de Google Cloud, asegura que Gemma pueda ser utilizado en casi cualquier entorno de desarrollo.

El precedente establecido por Gemini 1.5, con su ventana de contexto de 1 millón de tokens, ilustra el rápido avance de Google en el procesamiento del lenguaje natural. Esta capacidad supera ampliamente las ventanas de contexto de otros modelos como GPT-4 Turbo y Claude 2.1, marcando un antes y un después en nuestra capacidad para desarrollar conversaciones y textos que se sienten cada vez más humanos.