El nuevo ChatGPT tiene un coeficiente intelectual de 120

¿Preocupado por la posibilidad de que la inteligencia artificial tome el control del mundo? Probablemente deberías estarlo. Esa es mi nueva conclusión después de probar esta semana el nuevo modelo de OpenAI, “o1”. Este modelo ha superado a todas las demás inteligencias artificiales en la prueba de IQ de Mensa Noruega, logrando un rendimiento impresionante.

o1 logra una puntuación alta en la prueba de IQ

Hasta esta semana, los avances en inteligencia artificial parecían estancados. Las pruebas iniciales en febrero no mostraron mejoras en el IQ, pero eso cambió con la llegada del modelo o1. Este logró responder correctamente 25 de las 35 preguntas de la prueba de IQ, un resultado mucho más alto que el de la mayoría de los humanos.

Ejemplos de respuestas de o1 en preguntas de IQ

En www.maximumtruth.org tienes la pregunta más difícil del cuestionario, que o1 resolvió correctamente:

«Al analizar los patrones en la cuadrícula, vemos que cada columna combina ciertos componentes para incluir todos los elementos (V, V invertida, lados del rectángulo) en la tercera fila. En la tercera columna, los componentes Rleft y Rright (los lados del rectángulo) aún no han aparecido. Por lo tanto, la respuesta correcta para la celda vacía es la Opción D, que incluye la ‘v’ normal y los dos lados del rectángulo, completando el conjunto de componentes para esa columna.»

Precisión y margen de mejora

Aunque el modelo o1 acertó muchas preguntas, también se equivocó en algunas. Por ejemplo, en una pregunta que involucraba el mismo patrón que la anterior, o1 solo vio la parte aditiva del patrón y no logró identificar la parte de «eliminar líneas comunes». Por lo tanto, eligió la opción incorrecta. Esto muestra que, aunque o1 ha mejorado, aún no es infalible.

La mejora del IQ no se debe a datos de entrenamiento específicos

Una preocupación común es que los modelos de IA tengan una chuleta de respuestas a la que puedan acceder. Para lidiar con esta posibilidad, en abril, un miembro de Mensa ofreció crear nuevas preguntas de IQ. Al probar estas preguntas completamente nuevas en las IA, se vio que los modelos obtenían peores resultados, lo que sugiere que la mejora de o1 se debe a un avance real en su capacidad de razonamiento y no a un entrenamiento específico con preguntas de IQ.

En una publicación anterior sobre inteligencia artificial, en maximumtruth analizaron dos casos en los que ChatGPT-4 falló. Volvió a hacerle estas preguntas a o1, y las respondió correctamente. Incluso intentó engañarlo diciéndole que estaba equivocado, pero resistió y reafirmó sus respuestas correctas.

El nuevo modelo o1 de OpenAI muestra que las proyecciones rápidas sobre el progreso de la inteligencia artificial están en camino. Si esta tendencia se mantiene, podríamos ver IA alcanzando un IQ de 140 en 2026. ¡Eso es pronto!