Nueva IA de Microsoft es capaz de aprender de sus errores

Publicado el

robot ajedrez

En el ámbito de la inteligencia artificial (IA), corregir errores y mejorar continuamente son esenciales para avanzar. Recientemente, un equipo conjunto de Microsoft Research Asia, la Universidad de Pekín y la Universidad de Xi’an Jiaotong ha desvelado una técnica que permite a los modelos de lenguaje grande (LLMs) mejorar su capacidad para resolver problemas matemáticos, aprendiendo de sus errores al igual que lo hacen los humanos. Esta técnica se denomina Learning from Mistakes (LeMa).

La idea fundamental detrás de LeMa se inspira en cómo los humanos aprenden de sus errores. Cuando una persona se enfrenta a un error en una tarea matemática, analizar y corregir el error potencia su eficacia. De manera similar, LeMa imparte una capacidad autocorrectiva en la IA. Utilizando modelos como LLaMA-2 para generar rutas de razonamiento defectuosas en problemas matemáticos, y luego GPT-4 actúa como un «corrector», identificando, explicando y corrigiendo los errores. Estos caminos de razonamiento corregidos se utilizan luego para entrenar aún más a los modelos originales.

Aplicando LeMa, los investigadores observaron una mejora notable en el rendimiento en varias tareas matemáticas usando cinco diferentes LLMs. Es más, modelos especializados como WizardMath y MetaMath también se beneficiaron, alcanzando una precisión del 85.4% en el conjunto de datos GSM8K y 27.1% en MATH, estableciendo un nuevo récord para modelos de código abierto en estas tareas desafiantes.

Con el código fuente y los modelos utilizados en el estudio ahora disponibles en GitHub, la comunidad global de IA tiene una puerta abierta para continuar explorando esta dirección. Específicamente, sectores como salud, finanzas y desarrollo de vehículos autónomos podrían beneficiarse enormemente de sistemas que pueden mejorar continuamente mediante el análisis y corrección de sus propios errores. Este avance nos acerca a una era donde la IA no solo ejecuta tareas, sino que también es capaz de aprender eficazmente de sus errores, ampliando nuestra capacidad para resolver problemas cada vez más complejos.

El proyecto LeMa resalta el potencial inexplorado que aún reside en la IA, abriendo caminos hacia una comprensión más profunda de cómo las máquinas pueden emular procesos humanos de aprendizaje y mejora continua, lo que a largo plazo podría redefinir la naturaleza de la resolución de problemas tanto en el ámbito digital como en el real.

Más información en arxiv.org