Meta y su nueva IA que revisa a otras IA: ¿el principio del fin del feedback humano?

Juan Diego Polo

hace 6 meses

Ilustración minimalista y colorida que representa una red neuronal abstracta con nodos conectados por líneas, simbolizando el flujo de información en el aprendizaje automático. Los colores vibrantes y contrastantes como azul, verde, naranja y morado destacan sobre un fondo claro, transmitiendo la innovación tecnológica y los avances en inteligencia artificial. La imagen visualiza el concepto de aprendizaje continuo en redes neuronales y su capacidad de adaptación sin olvidar conocimientos previos. Nombre del archivo: redes_neuronales_adaptativas_aprendizaje_sin_olvidar.png Alt de la imagen: Ilustración minimalista sobre redes neuronales adaptativas y aprendizaje automático continuo. Descripción SEO: Imagen minimalista de redes neuronales con nodos y conexiones, que representa el aprendizaje automático continuo y la capacidad de adaptación de las redes neuronales sin olvidar conocimientos previos. Colores vibrantes y diseño abstracto para destacar avances en inteligencia artificial.

Imagínate un mundo donde las inteligencias artificiales no solo aprenden por sí solas, sino que también son capaces de revisar su propio trabajo sin la intervención de un humano. Bueno, Meta parece estar llevándonos en esa dirección con su más reciente creación: el Self-Taught Evaluator. Esta IA puede evaluar y revisar las respuestas generadas por otras IA, marcando un hito en el camino hacia el desarrollo de agentes autónomos más avanzados. Si ya la IA nos sorprendía con su capacidad para resolver problemas complejos, ahora puede que no necesitemos revisar si sus respuestas son correctas.

¿Qué es el Self-Taught Evaluator de Meta?

El Self-Taught Evaluator (Evaluador Autodidacta) es uno de los últimos modelos que Meta ha lanzado al mercado. Su principal característica es que utiliza datos generados completamente por IA para entrenarse, sin que los humanos participen en ese proceso. Es decir, la IA se enseña a sí misma y luego es capaz de verificar si las respuestas de otros modelos de IA son correctas. Y si te suena familiar, es porque Meta ha tomado prestado el concepto de la técnica de “cadena de pensamiento”, popularizada por OpenAI en sus modelos o1.

La cadena de pensamiento consiste en desglosar problemas complejos en pequeños pasos lógicos, como lo haría una persona al resolver un problema de matemáticas. Esto no solo mejora la precisión de las respuestas, sino que también ayuda a que las IA puedan abordar temas más complejos como la ciencia, la codificación y las matemáticas.

Menos humanos, más eficiencia

Si alguna vez has trabajado con IA, sabrás que uno de los grandes retos es el proceso llamado Refuerzo con Aprendizaje de Feedback Humano (RLHF, por sus siglas en inglés). Básicamente, este proceso requiere que los humanos etiqueten datos o verifiquen respuestas para que la IA sepa si lo está haciendo bien o no. Sin embargo, este enfoque es costoso y requiere expertos que dominen el tema para poder realizar este tipo de anotaciones.

Aquí es donde Meta espera cambiar las reglas del juego. Con el Self-Taught Evaluator, la idea es reducir la necesidad de intervención humana en este tipo de procesos, haciéndolo todo mucho más rápido y eficiente. Meta cree que cuanto más «superhumanas» se vuelvan las IA, más precisas serán a la hora de revisar su propio trabajo, e incluso mejor que un ser humano promedio.

¿Un futuro sin humanos verificando IA?

La idea de que las IA autónomas sean lo suficientemente inteligentes como para verificar su propio rendimiento podría sonar a ciencia ficción, pero estamos cada vez más cerca de esa realidad. Meta no está sola en esta carrera; otras empresas como Google y Anthropic también están investigando en la misma línea con el enfoque llamado RLAIF (Reinforcement Learning from AI Feedback), que básicamente es la idea de que las IA se proporcionen feedback entre ellas.

Es interesante pensar en cómo esto podría afectar a áreas como la atención al cliente, la programación o incluso la medicina, donde se espera que las IA no solo hagan el trabajo pesado, sino que también puedan autoverificarse y aprender de sus errores de forma continua.

Meta y su compromiso con la IA abierta

Meta sigue una filosofía de código abierto con sus modelos, lo que significa que muchos de ellos están disponibles para que los investigadores y desarrolladores experimenten y los utilicen. Esto contrasta con otras empresas, como Google, que tienden a mantener estos avances en un ámbito más cerrado. Es interesante ver cómo Meta está impulsando la investigación en este campo, compartiendo abiertamente herramientas que podrían revolucionar el futuro de la inteligencia artificial.

En WWWhatsnew.com hemos visto cómo estas iniciativas no solo aceleran el avance de la tecnología, sino que también permiten que la comunidad científica y los desarrolladores independientes tengan acceso a herramientas de vanguardia que, de otro modo, estarían fuera de su alcance. Este enfoque es clave para el crecimiento del ecosistema IA, haciendo que el progreso sea más inclusivo y colaborativo.

¿Qué otros avances presentó Meta?

Además del Self-Taught Evaluator, Meta también lanzó otros modelos de IA que merecen ser mencionados. Por ejemplo, una actualización del modelo Segment Anything, que acelera la generación de respuestas en los modelos de lenguaje y nuevos conjuntos de datos que podrían ayudar en la investigación de materiales inorgánicos. Estos avances reflejan el compromiso de Meta por liderar la carrera de la inteligencia artificial no solo en el ámbito del procesamiento de texto y voz, sino también en otras áreas como la ciencia de materiales y la visión por computadora.

El futuro de la IA, tal como lo pinta Meta, es uno donde los sistemas no solo resuelven problemas, sino que también se convierten en sus propios jueces, creando una capa de autonomía que podría cambiar para siempre la forma en que trabajamos con máquinas.