Gemini 2.5 Flash Native Audio: avances en la inteligencia de voz en tiempo real

Google ha dado un nuevo paso en la evolución de sus modelos de inteligencia artificial al presentar la versión mejorada de Gemini 2.5 Flash Native Audio, una tecnología pensada para mejorar la interacción por voz en tiempo real. A diferencia de las versiones anteriores centradas en la generación de voz, este avance está diseñado para conversaciones naturales, funcionales y contextualizadas, lo que permite a los asistentes de voz actuar como verdaderos interlocutores.

Esta versión se ha integrado ya en varios productos de Google como Google AI Studio, Vertex AI y, por primera vez, se está desplegando en Gemini Live y Search Live. Esto implica que funciones como la ayuda en tiempo real al buscar información o desarrollar ideas con un asistente virtual se vuelven mucho más realistas y fluidas. Continúa leyendo «Gemini 2.5 Flash Native Audio: avances en la inteligencia de voz en tiempo real»

Traducción de las conversaciones en vivo, lo nuevo de Alexa

Prácticamente un año después de la llegada del Modo Intérprete al Asistente de Google, facilitando que las personas puedan llevar a cabo conversaciones en vivo con otras que hablen en distinto idioma, Alexa acaba de estrenar una función similar llamada Live Translation (o Traducción en Vivo).

Por ahora es una función que vivirá en dispositivos Echo de la compañía, tanto en altavoces como en pantallas inteligentes, haciéndolos más atractivos de cara a las fiestas navideñas, un plus adicional para su elección frente a otras opciones como regalo.
Continúa leyendo «Traducción de las conversaciones en vivo, lo nuevo de Alexa»