La inteligencia artificial comienza a comprender el habla con FocalCodec, un nuevo sistema de compresión de voz

Los modelos de lenguaje grande (LLMs, por sus siglas en inglés), como ChatGPT o Gemini, han dejado de ser herramientas centradas solo en texto para convertirse en sistemas multimodales capaces de trabajar con imágenes, audio, vídeos y música. Sin embargo, integrar la voz humana en estos modelos no ha sido una tarea sencilla. A diferencia del texto, la voz es un canal de comunicación mucho más cargado de información: no solo contiene palabras, sino también emociones, acentos, tono e identidad.

La estrategia habitual para incorporar el habla a estos sistemas consiste en convertir el audio en tokens de audio, pequeñas unidades digitales comparables a las letras en un texto. Pero esos tokens, aunque funcionales, siguen siendo muy densos: cada segundo de audio contiene una gran cantidad de datos que dificulta su procesamiento por parte de los modelos. Esto ha limitado seriamente el avance de la comprensión de la voz por parte de la inteligencia artificial. Continúa leyendo «La inteligencia artificial comienza a comprender el habla con FocalCodec, un nuevo sistema de compresión de voz»

OpenAI o3 alcanza 135 puntos de IQ: ¿qué significa realmente este hito para la inteligencia artificial?

Cuando escuchamos que un modelo de IA supera la media humana en un test de coeficiente intelectual, es tentador imaginarlo como ese estudiante prodigio que resuelve crucigramas antes de que suene el timbre. Sin embargo, medir la inteligencia de las máquinas no es tan sencillo como pasarles un examen escolar. En el fondo, evaluar a una IA es como preguntar a un GPS cuán buen explorador sería en una ciudad sin carreteras: necesitamos pruebas pensadas para su “forma de moverse”. Por eso el IQ de Mensa se ha convertido en un terreno de juego exigente, diseñado originalmente para humanos pero cada vez más usado para comparar algoritmos. Continúa leyendo «OpenAI o3 alcanza 135 puntos de IQ: ¿qué significa realmente este hito para la inteligencia artificial?»

Llama 4: la nueva apuesta de Meta en IA que deja fuera a la Unión Europea

Meta ha presentado Llama 4, su nueva familia de modelos de inteligencia artificial generativa, con la que busca posicionarse como un referente frente a gigantes como OpenAI con GPT-4o y Google con Gemini 2.0. La compañía asegura que sus nuevos modelos no solo están a la altura de la competencia, sino que los superan en áreas clave como la programación, el razonamiento y la traducción automática.

Pero hay un detalle importante que no ha pasado desapercibido: los usuarios de la Unión Europea no tendrán acceso completo a estos nuevos modelos, al menos por ahora. Veamos por qué Meta ha tomado esta decisión y qué implicaciones tiene este movimiento tanto para desarrolladores como para usuarios. Continúa leyendo «Llama 4: la nueva apuesta de Meta en IA que deja fuera a la Unión Europea»

Meta lanza Llama 4: los nuevos modelos de IA que marcan un salto gigante en rendimiento y eficiencia

Meta ha subido una vez más la apuesta en el mundo de la inteligencia artificial con el lanzamiento de los modelos Llama 4, una nueva generación que no solo amplía las capacidades técnicas de los modelos anteriores, sino que también pone a disposición del público herramientas multimodales de altísimo nivel. Con nombres que evocan agilidad e innovación —Llama 4 Scout, Maverick y Behemoth— esta nueva camada promete transformar desde asistentes virtuales hasta tareas complejas de codificación, razonamiento y análisis visual.

Continúa leyendo «Meta lanza Llama 4: los nuevos modelos de IA que marcan un salto gigante en rendimiento y eficiencia»

Google presenta Gemini 2.5, ¿el más inteligente hasta la fecha?

Google DeepMind lo ha vuelto a hacer. Con el lanzamiento de Gemini 2.5, estamos frente a una nueva generación de inteligencia artificial que no solo responde, sino que piensa, razona y decide con mayor precisión que nunca. Este modelo no es solo una mejora, es una declaración de intenciones sobre el futuro del pensamiento automatizado, compitiendo con o1, o3, deepseek r1 y grok Think.

Continúa leyendo «Google presenta Gemini 2.5, ¿el más inteligente hasta la fecha?»

Baidu refuerza su apuesta por la IA con el lanzamiento de Ernie 4.5 y Ernie X1

El gigante chino de las búsquedas, Baidu, ha anunciado la llegada de dos nuevos modelos de inteligencia artificial, consolidando su papel en la creciente competencia global en el sector. Se trata de Ernie 4.5, una versión mejorada de su modelo fundacional lanzado hace dos años, y Ernie X1, un modelo centrado en el razonamiento avanzado. Con estas actualizaciones, Baidu busca ofrecer soluciones más accesibles y potentes, en un entorno dominado por empresas como OpenAI, DeepSeek y Google.

Continúa leyendo «Baidu refuerza su apuesta por la IA con el lanzamiento de Ernie 4.5 y Ernie X1»

Anthropic lanza Claude 3.5 Haiku: ¿un competidor real para los grandes modelos?

Anthropic, una de las empresas más innovadoras en inteligencia artificial, ha dado a conocer Claude 3.5 Haiku, la última iteración de su modelo más rápido y compacto. Este anuncio llega en un momento clave, ya que la competencia en el campo de la inteligencia artificial sigue intensificándose con avances como el reciente Gemini 2.0 de Google. Desde WWWhatsnew.com, analizamos cómo este lanzamiento puede impactar el panorama actual y qué lo diferencia de sus predecesores y rivales.

Continúa leyendo «Anthropic lanza Claude 3.5 Haiku: ¿un competidor real para los grandes modelos?»

Amazon Nova: La nueva generación de modelos de IA generativa de AWS

La inteligencia artificial (IA) sigue avanzando a pasos agigantados, y Amazon Web Services (AWS) no se queda atrás. Con el lanzamiento de Amazon Nova, AWS introduce al mercado una nueva línea de modelos de IA generativa diseñados para redefinir el estándar en capacidades multimodales y generación creativa. Desde WWWhatsnew.com hemos analizado a fondo esta nueva tecnología, que promete revolucionar cómo las empresas y los desarrolladores integran IA en sus operaciones.

Continúa leyendo «Amazon Nova: La nueva generación de modelos de IA generativa de AWS»

Mistral AI presenta avances que redefinen la inteligencia artificial multimodal

Mistral AI se posiciona de nuevo como un jugador clave  en la IA gracias a su reciente lanzamiento de nuevas herramientas y modelos avanzados. La startup francesa, conocida por su enfoque innovador, ha introducido una serie de actualizaciones que prometen transformar cómo interactuamos y aprovechamos la inteligencia artificial, desde el análisis de documentos hasta la generación de imágenes y la automatización de tareas.

Continúa leyendo «Mistral AI presenta avances que redefinen la inteligencia artificial multimodal»

Cómo mistral AI revoluciona el cómputo en el borde con sus innovadores modelos multimodales

Hoy nos embarcamos en un emocionante viaje por el universo de la inteligencia artificial, explorando las últimas novedades en modelos para el cómputo en el borde y otras innovaciones que están dando de qué hablar. Así que, ¡ajusta tus neuronas porque esto va a ser interesante!

Continúa leyendo «Cómo mistral AI revoluciona el cómputo en el borde con sus innovadores modelos multimodales»