Etiqueta: Gemma 4 12B audio nativo open weights

Gemma 4 12B: el modelo multimodal de Google que corre en tu portátil con 16 GB de RAM y procesa texto, imagen y voz sin encoders separados

Publicado el 5 junio, 2026

Google DeepMind publicó el 3 de junio de 2026 el developer guide y las instrucciones de despliegue de Gemma 4 12B, el nuevo modelo open-weights de la familia Gemma que completa el tramo entre los modelos de borde ligeros y los modelos de servidor. La novedad técnica más relevante: no tiene encoders de visión ni de audio separados. Texto, imagen y audio entran directamente en el backbone del LLM. En un portátil con 16 GB de RAM unificada (o VRAM dedicada), Gemma 4 12B puede correr localmente y manejar los tres. Continúa leyendo «Gemma 4 12B: el modelo multimodal de Google que corre en tu portátil con 16 GB de RAM y procesa texto, imagen y voz sin encoders separados»