Las últimas novedades en IA de Google Cloud

En el evento Google Cloud Next, se han presentado actualizaciones significativas pensadas en el mundo empresarial, todas ellas con la inteligencia artificial (IA) y el aprendizaje automático como protagonistas.

Aquí os comento los puntos más destacados.

Gemini 1.5 Pro ya permite escuchar audios

El lanzamiento de Gemini 1.5 Pro en vista previa pública es una de las grandes novedades. Este trae consigo la ventana de contexto más grande disponible, permitiendo un análisis y generación de contenido mucho más complejos, y ahora tiene la capacidad de procesar flujos de audio. Esto abre un nuevo horizonte de posibilidades para analizar y generar contenido a partir de una variedad de medios, desde texto hasta video y audio.

Imagen 2.0: Nuevas dimensiones en la generación de contenido

Imagen 2.0 ha recibido actualizaciones que permiten la creación de imágenes en vivo, como GIFs, desde simples indicaciones de texto, y la edición de imágenes con herramientas como inpainting/outpainting y marca de agua digital. Esta capacidad de generar y editar contenido visual de alta calidad con facilidad es un gran paso adelante para equipos de marketing y creativos.

En estos dos vídeos podemos ver cómo se generan vídeos y como se editan imágenes fácilmente:

CodeGemma: elevando el código al próximo nivel

La introducción de CodeGemma añade una herramienta poderosa para los desarrolladores, facilitando la generación, explicación y transformación de código.

CodeGemma es un modelo de inteligencia artificial (IA) recientemente anunciado por Google Cloud, que forma parte de la familia de modelos Gemma. Está diseñado específicamente para mejorar y facilitar el trabajo de los desarrolladores en tareas relacionadas con la codificación. Aunque el anuncio original no entra en detalles exhaustivos sobre todas las capacidades específicas de CodeGemma, podemos inferir y explicar sus funciones basándonos en el contexto de su lanzamiento y en lo que se conoce sobre modelos de IA similares en el ámbito del desarrollo de software.

Generación de Código: CodeGemma puede ayudar a los desarrolladores a generar bloques de código automáticamente basándose en descripciones de alto nivel. Por ejemplo, si un desarrollador necesita escribir una función para ordenar una lista, podría describir la tarea en términos simples y el modelo generaría el código correspondiente.
Explicación de Código: Esta herramienta tiene el potencial de explicar bloques de código existentes, facilitando la comprensión de programas complejos o poco documentados. Esto es especialmente útil para la revisión de código y el aprendizaje de nuevos lenguajes o bibliotecas.
Transformación de Código: CodeGemma podría ser capaz de tomar un bloque de código y transformarlo para mejorar su eficiencia, legibilidad o para adaptarlo a diferentes estándares de codificación.
Soporte Multilenguaje: Aunque no se especifica, es probable que, al igual que otros modelos de su tipo, CodeGemma ofrezca soporte para múltiples lenguajes de programación, abarcando desde los más utilizados como JavaScript, Python y Java, hasta aquellos más específicos o menos comunes.
Integración con Herramientas de Desarrollo: Es de esperar que CodeGemma se integre de manera fluida con el ecosistema de desarrollo de software, incluyendo IDEs (Entornos de Desarrollo Integrados), plataformas de colaboración de código, y sistemas de control de versiones, entre otros.

MLOps en Vertex AI: Gestión de Modelos a Gran Escala

Las capacidades expandidas de MLOps en Vertex AI merecen una mención especial. La gestión y despliegue eficientes de modelos de IA en producción son fundamentales para su éxito en aplicaciones empresariales. Las nuevas herramientas de gestión de prompts y servicios de evaluación son parte de las novedades presentadas.

En la nota que han publicado indican la expansión en el acceso a modelos empresariales listos y las garantías de residencia de datos en nuevos países, cumpliendo así con las regulaciones y requisitos de seguridad.