Google da un golpe en la mesa con nuevos modelos de IA multimedia: imagen, video, audio y música generativa con nivel profesional

Publicado el

Ilustración surrealista sobre inteligencia artificial generativa con pincel, vídeo y música

La conferencia Google I/O 2025 ha dejado claro que el gigante tecnológico no quiere quedarse atrás en la carrera de la inteligencia artificial generativa. A través del anuncio de sus nuevos modelos Imagen 4, Veo 3, Lyria 2 y la herramienta creativa Flow, Google apuesta fuerte por un futuro donde la IA no solo asiste, sino que colabora activamente en procesos creativos.

Imagen 4: Diseño visual con calidad profesional

Imagen 4 representa la evolución del modelo generativo de Google para la creación de imágenes hiperrealistas a partir de texto. No se trata solo de una mejora incremental, sino de una versión que marca un antes y un después en cuanto a calidad y versatilidad:

  • Detalles visuales como texturas, reflejos o materiales complejos están representados con gran fidelidad.
  • Soporta resolución de hasta 2K, ideal para proyectos impresos, presentaciones o material publicitario.
  • Incorpora una capacidad tipográfica precisa, lo que permite generar imágenes con textos legibles y bien integrados. Esto es especialmente últil para carteles, memes, tarjetas o historietas.
  • Una versión rápida está disponible, con una velocidad de respuesta 10 veces mayor que su antecesor.

Disponible dentro del ecosistema de Gemini, en apps como Google Docs, Slides y Vertex AI, Imagen 4 se presenta como una herramienta accesible tanto para empresas como para usuarios creativos.

Veo 3: Video generado por IA con audio integrado

El siguiente salto lo da Veo 3, el nuevo modelo de generación de video con sonido nativo. Hasta ahora, los modelos de este tipo ofrecían clips mudos, pero Google rompe esa barrera:

  • Permite crear escenas completas con sonido ambiental, diálogos sincronizados y música, todo a partir de descripciones en lenguaje natural.
  • Posee una comprensión narrativa avanzada, lo que le permite generar historias visuales coherentes.
  • Incluye controles de cámara como zooms o rotaciones, y funciones de edición como la adición o eliminación de objetos.
  • Está integrado en el entorno profesional Vertex AI y en la herramienta creativa Flow.

Google se mete de lleno a competir con propuestas como Runway, Meta o Pika, pero con una gran ventaja: la incorporación del audio desde la generación inicial, lo que reduce pasos adicionales y mejora la coherencia de los contenidos.

Flow: la suite creativa para cineastas y narradores visuales

Flow es una de las propuestas más completas presentadas. Más que una herramienta, es una plataforma de creación audiovisual impulsada por IA. Combina las capacidades de Veo, Imagen y Gemini para ofrecer:

  • Generación de clips cinematográficos a partir de prompts.
  • Control sobre los elementos clave de una producción: puesta en escena, estilo visual, personajes y banda sonora.
  • Acceso a recursos como Flow TV, donde se pueden consultar proyectos creados por otros usuarios, incluyendo sus descripciones originales.
  • Uso de activos propios o generados en el entorno de trabajo.

Destinada a suscriptores de los planes Google AI Pro y Ultra, por ahora está disponible en EE. UU., pero es de esperar que su despliegue se amplíe en los próximos meses.

Lyria 2: música generada y personalizada por IA

En el ámbito musical, Google lanza Lyria 2, acompañado del entorno Music AI Sandbox. Diseñado para músicos y productores, este modelo ofrece:

  • Composición musical desde descripciones textuales.
  • Exploración y edición en tiempo real gracias a Lyria RealTime, lo que permite ajustar elementos como ritmo, armonías o estilo mientras se genera.
  • Integración con YouTube Shorts, ideal para creadores de contenido.

Lyria fue desarrollado en colaboración con artistas, lo que garantiza que funcione como una herramienta de apoyo, no como un reemplazo. El objetivo es ampliar las posibilidades creativas, no sustituir el talento humano.

Seguridad y transparencia: marcas de agua invisibles

Todos los contenidos generados con estas herramientas incluyen marcas de agua invisibles, una forma de asegurar la trazabilidad y prevenir el uso malintencionado. Este detalle, aunque discreto, es clave para fomentar un uso ético y responsable de la IA.

IA como compañera creativa

La estrategia de Google pone el foco en la colaboración entre humanos e inteligencia artificial. Lejos de automatizar completamente la creación, la idea es que estas herramientas funcionen como copilotos creativos, ayudando a ejecutar ideas con más precisión y rapidez.

Si un ilustrador quiere crear una portada con una composición compleja, ahora puede apoyarse en Imagen 4. Si un cineasta independiente necesita visualizar una escena con sonido, Veo 3 es una opción accesible. Y si un músico busca experimentar con nuevos estilos, Lyria 2 le ofrece un laboratorio completo.

Estos modelos son parte de un ecosistema más grande que Google está construyendo con Gemini como motor central, integrando funcionalidades en productos cotidianos y profesionales.