OpenAI y la nueva fiebre del audio: cuando hablar vuelve a ser la interfaz

OpenAI está redoblando su inversión en audio con una ambición que va bastante más allá de que ChatGPT “suene mejor”. Según una información publicada por The Information, la compañía ha reorganizado durante los dos últimos meses varios equipos de ingeniería, producto e investigación para rehacer a fondo sus modelos de voz. El objetivo no sería solo mejorar la experiencia en pantalla, sino preparar el terreno para un dispositivo personal audio-first que, siempre según esa misma fuente, llegaría aproximadamente dentro de un año.

La idea de un aparato centrado en la voz encaja con una intuición que se repite en Silicon Valley: la pantalla, sin desaparecer, empieza a estorbar en muchos momentos del día. Si el teléfono fue el mando a distancia de nuestra vida digital, el audio aspira a convertirse en el “manos libres” permanente. La consecuencia práctica es clara: la conversación deja de ser un complemento para convertirse en el canal principal. Continúa leyendo «OpenAI y la nueva fiebre del audio: cuando hablar vuelve a ser la interfaz»

LLaMA-Omni: La IA de Código Abierto que Desafía a Siri y Alexa

Imagina que tu asistente digital pueda responderte con la misma rapidez y naturalidad que un amigo al otro lado del teléfono. Bueno, eso es exactamente lo que el nuevo modelo de inteligencia artificial LLaMA-Omni promete hacer. Este avance, desarrollado por la Academia China de Ciencias, podría cambiar para siempre cómo interactuamos con los asistentes digitales y transformar sectores enteros, desde el servicio al cliente hasta la atención médica. ¡Vamos a profundizar en cómo funciona y por qué debería importarte!

Continúa leyendo «LLaMA-Omni: La IA de Código Abierto que Desafía a Siri y Alexa»