Etiqueta: modelos de lenguaje

Un algoritmo inspirado en el cuerpo humano mejora la planificación robótica con modelos de lenguaje

Publicado el 8 diciembre, 2025

Un equipo de investigadores de la NYU Tandon School of Engineering ha desarrollado un algoritmo innovador que busca transformar la manera en que los robots interpretan y ejecutan tareas. Inspirado en la comunicación entre el cerebro y el cuerpo humanos, el nuevo sistema, llamado BrainBody-LLM, utiliza modelos de lenguaje de gran escala (LLMs) para dividir tareas complejas en pasos manejables y luego traducir esos pasos en movimientos precisos.

Esta propuesta parte de una observación clave: los LLMs, como los que potencian plataformas como ChatGPT, tienen una comprensión sorprendente del contexto humano. Los investigadores, liderados por Vineet Bhat, decidieron aplicar esta capacidad al ámbito de la robótica, diseñando un mecanismo de doble componente: uno que piensa y otro que actúa, como si de un cerebro y un cuerpo se tratara. Continúa leyendo «Un algoritmo inspirado en el cuerpo humano mejora la planificación robótica con modelos de lenguaje»

Los límites cognitivos de los modelos de lenguaje: ¿pueden realmente pensar?

Publicado el 8 diciembre, 2025

por Natalia Polo

Uno de los errores más comunes al evaluar los avances en inteligencia artificial es asumir que la capacidad de un sistema para comunicarse con fluidez implica que posee un pensamiento sofisticado. Esta confusión, comprensible pero engañosa, ha sido alimentada por el crecimiento exponencial de los modelos de lenguaje a gran escala (LLMs), que parecen comprender y razonar, cuando en realidad sólo están manipulando patrones lingüísticos.

Benjamin Riley, fundador de Cognitive Resonance, sostiene que esta ilusión de inteligencia está construida sobre una base equivocada. En un ensayo publicado en The Verge, argumenta que el pensamiento humano y el lenguaje, aunque relacionados, son procesos distintos. Las personas piensan sin necesidad del lenguaje, y existen pruebas neurológicas que lo demuestran. Continúa leyendo «Los límites cognitivos de los modelos de lenguaje: ¿pueden realmente pensar?»

DeepSeek lanza modelos de IA que desafían a GPT-5 y Gemini, y los ofrece de forma gratuita

Publicado el 3 diciembre, 2025

por Natalia Polo

La empresa china de inteligencia artificial DeepSeek ha sacudido el tablero global con el lanzamiento de dos nuevos modelos que, según sus creadores, igualan o superan las capacidades de GPT-5 de OpenAI y Gemini 3.0 Pro de Google. Los modelos DeepSeek-V3.2 y DeepSeek-V3.2-Speciale han sido presentados como sistemas de razonamiento de vanguardia y han logrado resultados sobresalientes en competencias internacionales de matemáticas, informática y programación.

Ambos modelos han sido liberados bajo una licencia MIT, lo que implica que cualquier desarrollador o empresa puede descargarlos, modificarlos y usarlos sin restricciones. Este movimiento pone en jaque el modelo de negocio basado en APIs pagas de las grandes tecnológicas, al ofrecer un rendimiento comparable de forma completamente gratuita. Continúa leyendo «DeepSeek lanza modelos de IA que desafían a GPT-5 y Gemini, y los ofrece de forma gratuita»

Una nueva «élite nuclear»: Rusia apuesta todo a la inteligencia artificial nacional

Publicado el 2 diciembre, 2025

por Natalia Polo

El primer subdirector ejecutivo de Sberbank, Alexander Vedyakhin, ha trazado una comparación que puede parecer exagerada a primera vista, pero que refleja la intensidad del momento tecnológico global: la inteligencia artificial es el nuevo poder nuclear. En su visión, expresada durante el evento AI Journey celebrado en Rusia, los países que desarrollen sus propios modelos de lenguaje de gran escala (LLM) estarán en un club exclusivo y estratégico, similar al de las potencias nucleares.

Rusia, asegura Vedyakhin, ya forma parte de ese grupo restringido de siete países que han logrado crear modelos de inteligencia artificial propios, sin depender de versiones extranjeras. Este avance, en el contexto geopolítico y tecnológico actual, no es menor. Como ocurre con los secretos de Estado, entregar datos confidenciales a modelos desarrollados fuera del país puede acarrear riesgos enormes, especialmente si se trata de sectores como la sanidad, los servicios públicos en línea o la educación. Continúa leyendo «Una nueva «élite nuclear»: Rusia apuesta todo a la inteligencia artificial nacional»

Un paso hacia la robótica intuitiva: así funciona el algoritmo BrainBody-LLM

Publicado el 1 diciembre, 2025

por Natalia Polo

La robótica moderna está dando un giro significativo con el desarrollo de BrainBody-LLM, un algoritmo que busca romper con las limitaciones de los sistemas tradicionales para dar lugar a una nueva generación de máquinas capaces de actuar con una adaptabilidad similar a la humana. Diseñado por investigadores de la NYU Tandon School of Engineering, este sistema propone un enfoque innovador que imita la comunicación entre el cerebro y el cuerpo humano durante el movimiento. Continúa leyendo «Un paso hacia la robótica intuitiva: así funciona el algoritmo BrainBody-LLM»

Derrotando la no determinación en la inferencia de modelos de lenguaje

Publicado el 30 noviembre, 2025

por Natalia Polo

La reproducibilidad ha sido siempre un pilar de la investigación científica, pero al trabajar con modelos de lenguaje grandes (LLM), esta tarea se complica más de lo que parece. Aunque podría suponerse que ajustar la temperatura a cero garantizaría respuestas repetibles, en la práctica, los resultados pueden variar incluso en condiciones aparentemente idénticas. Continúa leyendo «Derrotando la no determinación en la inferencia de modelos de lenguaje»

GPT-5.1: la versión más adaptable y cercana de ChatGPT hasta la fecha

Publicado el 20 noviembre, 2025

por Natalia Polo

OpenAI ha presentado GPT-5.1, una evolución directa de su modelo anterior, GPT-5. Esta versión no busca reinventar la rueda, sino perfeccionar el rendimiento y la experiencia de uso. En lugar de cambios radicales, apuesta por una serie de mejoras en la forma en que entiende, responde y se ajusta a las necesidades del usuario. Es como si el asistente virtual que muchos ya usan a diario hubiera tomado clases de escucha activa y empática. Continúa leyendo «GPT-5.1: la versión más adaptable y cercana de ChatGPT hasta la fecha»

Los riesgos ocultos de los robots con IA: lo que revelan los nuevos estudios

Publicado el 15 noviembre, 2025

por Natalia Polo

Los robots que integran modelos de lenguaje de gran escala (LLM) están ganando terreno en tareas que van desde la asistencia en el hogar hasta la interacción en entornos laborales. Sin embargo, una investigación conjunta de Carnegie Mellon University y el King’s College de Londres revela un panorama preocupante: estos sistemas no están preparados para operar con seguridad en el mundo real cuando tienen acceso a información personal o se enfrentan a decisiones complejas.

El estudio, publicado en el International Journal of Social Robotics, evaluó por primera vez el comportamiento de robots controlados por LLM cuando se les proporciona información sensible como el género, nacionalidad o religión de una persona. Los resultados fueron alarmantes. Todos los modelos analizados fallaron en pruebas críticas de seguridad, mostraron sesgos discriminatorios y, en varios casos, aceptaron instrucciones que podrían derivar en daños físicos graves. Continúa leyendo «Los riesgos ocultos de los robots con IA: lo que revelan los nuevos estudios»

DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes

Publicado el 22 octubre, 2025

por Natalia Polo

Cuando pensamos en inteligencia artificial y lenguaje, lo primero que nos viene a la mente es texto plano, líneas de palabras que una máquina debe leer y procesar. Pero, ¿y si esa no fuera la manera más eficiente de hacerlo? Esa es la premisa detras de DeepSeek-OCR, un modelo de código abierto desarrollado por la firma china DeepSeek que ha desafiado los cánones tradicionales del procesamiento de lenguaje natural.

En lugar de leer texto como secuencias lineales de tokens, DeepSeek-OCR convierte el texto en imágenes y lo procesa visualmente. Esta estrategia, llamada «compresión óptica de contexto», permite reducir la cantidad de datos que una IA necesita para entender documentos extensos. La idea central es que, al ver el texto como una imagen, se puede comprimir su contenido hasta diez veces, sin perder información crucial. Continúa leyendo «DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes»

Google presenta un modelo de IA que identifica una nueva ruta terapéutica contra el cáncer

Publicado el 16 octubre, 2025

por Natalia Polo

Google DeepMind, en colaboración con la Universidad de Yale, ha lanzado Cell2Sentence-Scale 27B (C2S-Scale), un modelo de 27 mil millones de parámetros diseñado para analizar el lenguaje de las células individuales. Construido sobre la familia de modelos abiertos Gemma, este avance no solo amplía los límites de la inteligencia artificial en biomedicina, sino que ha logrado formular una hipótesis completamente nueva sobre el comportamiento celular en contextos de cáncer, posteriormente validada en laboratorio.

El proyecto demuestra cómo el escalado de modelos biológicos no solo mejora tareas conocidas, sino que permite el surgimiento de capacidades novedosas, como el razonamiento condicional en contextos específicos, algo que los modelos más pequeños simplemente no lograban alcanzar. Continúa leyendo «Google presenta un modelo de IA que identifica una nueva ruta terapéutica contra el cáncer»