o3 y o4-mini: las nuevas IA de OpenAI que piensan, razonan y programan como nunca antes

Publicado el

La inteligencia artificial no se detiene, y OpenAI acaba de lanzar lo que posiblemente sea el mayor salto cualitativo en IA desde la llegada de GPT-4: los modelos O3 y O4-mini. Estas nuevas versiones no son simples mejoras, sino una evolución profunda que los convierte no solo en modelos, sino en sistemas inteligentes completos capaces de usar herramientas, razonar visualmente y generar ideas originales.

Y sí, todo esto ya está llegando a ChatGPT, incluso para usuarios gratuitos.


¿Por qué estos modelos son tan revolucionarios?

Greg Brockman, presidente de OpenAI, lo dejó claro: O3 y O4-mini son los primeros modelos que generan ideas nuevas realmente útiles, según expertos del más alto nivel. En palabras sencillas, no solo repiten o recombinan información existente, sino que proponen soluciones originales.

Un ejemplo concreto: O3 fue capaz de proponer una arquitectura de software innovadora que ni siquiera los ingenieros de OpenAI habían considerado antes.


La clave: pensar con herramientas

Hasta ahora, los modelos de razonamiento eran como genios muy capaces, pero encerrados en una habitación sin acceso a nada. O3 y O4-mini pueden salir de esa habitación. Utilizan herramientas externas como:

  • Navegación web

  • Intérprete de Python

  • Lectura de archivos

  • Generación y análisis de imágenes

  • Modo de voz avanzado

  • Memoria contextual personalizada

Y lo más impactante: usan estas herramientas como parte activa de su proceso de pensamiento. Por ejemplo, O3 puede hacer más de 600 llamadas a herramientas distintas para resolver un único problema complejo. Es como ver a un científico investigando paso a paso, de forma lógica y guiada.


Pensamiento visual y razonamiento multimodal

Uno de los grandes avances es el razonamiento con imágenes. Pero no como antes. Ahora, los modelos no solo «ven» una imagen, sino que piensan con ella: hacen zoom, rotan, recortan, comparan patrones y, si hace falta, buscan en la web para encontrar información complementaria.

Durante una demostración, se mostró cómo O3 fue capaz de analizar un póster científico borroso, encontrar los elementos clave, darse cuenta de que el resultado principal no estaba incluido, y entonces continuar la investigación por su cuenta hasta calcularlo y contrastarlo con estudios actuales.

Esto antes requería días de trabajo humano. Ahora se hace en minutos.


¿Y si le pides algo personal?

Gracias a la memoria, O3 puede recordar tus intereses y adaptar sus respuestas. Un investigador le pidió que buscara noticias que le resultaran interesantes, y el modelo encontró un artículo sobre cómo los sonidos grabados de arrecifes saludables pueden ayudar a regenerar corales… algo que combinaba perfectamente con sus intereses en música y buceo.

Además de contarlo, generó un blog post listo para publicar, con visualizaciones de datos y fuentes citadas. Todo automatizado, pero con sensibilidad humana.


O3 también es programador. Y de los buenos.

Otra gran virtud de estos modelos es su habilidad para trabajar en proyectos reales de software, no solo generar fragmentos de código sueltos. O3 navega por bases de código complejas, detecta errores, entiende el flujo de las aplicaciones y propone parches efectivos.

En una prueba con un repositorio de Python llamado senpai, el modelo detectó un bug, exploró la herencia de clases, propuso una solución, aplicó el parche y luego corrió pruebas unitarias para validar su arreglo. Como lo haría un desarrollador humano, pero a velocidad sobrehumana.


Codex CLI: la revolución del desarrollo con IA

Aprovechando estas capacidades, OpenAI presentó Codex CLI, una interfaz ligera que permite a los usuarios conectar estos modelos directamente con su sistema operativo. Puedes darle acceso a tu terminal, arrastrar imágenes o archivos, y el modelo trabajará con ellos en tiempo real, proponiendo o ejecutando comandos según lo que necesites.

Este entorno permite trabajar en dos modos: uno supervisado, donde apruebas cada acción, y otro automático, con límites seguros para evitar riesgos. Todo esto con el poder de O3 y O4-mini como cerebro del sistema.


Resultados que impresionan

Los nuevos modelos han sido evaluados en múltiples benchmarks exigentes. Algunos resultados clave:

  • AIME (matemáticas): O4-mini alcanza un 99% de precisión con herramientas, prácticamente saturando la prueba.

  • GPQA (preguntas de nivel doctorado): O3 supera el 83% de precisión.

  • SWE-Bench (resolución de bugs reales): O3 logra el 69,1%, mejor que su predecesor y muchos modelos rivales.

  • Vista y MMU (visión multimodal): grandes mejoras en tareas de análisis visual complejo.

Y lo más importante: logran estos resultados con menor coste de inferencia y mayor velocidad, lo que los hace ideales para aplicaciones reales.


¿Qué significa esto para ti?

No necesitas ser científico ni programador para beneficiarte de estas mejoras. O3 y O4-mini ya están disponibles en ChatGPT Plus, Pro y Team, y O4-mini se puede usar gratis al activar la función «Razonar».

Si trabajas con textos, imágenes, código, ideas o simplemente quieres respuestas más inteligentes y adaptadas, estás a un clic de descubrir una nueva forma de interactuar con la tecnología.

Además, OpenAI ha anunciado que Codex CLI será de código abierto, y ha lanzado una iniciativa de 1 millón de dólares en créditos API para impulsar proyectos open source que integren estas herramientas.


Una IA más útil, personal y potente

Más allá de los números y la tecnología, O3 y O4-mini representan un cambio de paradigma: IA que piensa como un humano experto, usa herramientas como uno y aprende como uno, pero con la velocidad y eficiencia de las máquinas.

Y si eso no es un paso real hacia la inteligencia artificial general (AGI), se le parece mucho.

Comparte en: