MIT desarrolla un nuevo enfoque para entrenar robots de propósito general

Publicado el

Ilustración minimalista y divertida en tonos pasteles suaves que representa la seguridad en inteligencia artificial. La imagen muestra un robot amigable interactuando cautelosamente con símbolos de protección como un escudo, un candado y una balanza, creando un ambiente reflexivo pero ligero. Ideal para acompañar artículos sobre riesgos y ética en IA.

En un avance revolucionario para la robótica, investigadores del Instituto Tecnológico de Massachusetts (MIT) han presentado un sistema que podría acercarnos a un futuro donde los robots sean tan adaptables y multifuncionales como los vemos en la ciencia ficción. Inspirado en los avances de los modelos de lenguaje como GPT-4, este enfoque, denominado Transformadores Preentrenados Heterogéneos (HPT, por sus siglas en inglés), promete cambiar la manera en que los robots aprenden y se adaptan a nuevas tareas.

¿Por qué es revolucionario este enfoque de entrenamiento?

El entrenamiento de robots ha sido tradicionalmente complejo, costoso y limitado a tareas específicas. Hasta ahora, cada robot necesitaba un entorno controlado y datos especializados para aprender, lo cual los hacía poco flexibles y difíciles de adaptar a nuevas situaciones. Con HPT, los investigadores han encontrado una forma de unificar datos heterogéneos de diversas fuentes, creando un sistema que facilita el aprendizaje de tareas variadas y mejora su capacidad de respuesta ante cambios en el entorno.

HPT: Un cerebro universal para robots

El núcleo del sistema HPT es un transformador, una red neuronal que recibe y procesa datos de distintos sensores, como visión y propiocepción. Esto permite que el robot construya un “lenguaje compartido” que le ayuda a entender y aprender tareas de una forma similar a cómo las redes neuronales aprenden en modelos de lenguaje. En palabras de Lirui Wang, autor principal del estudio, “nuestro trabajo demuestra cómo se puede entrenar a un robot utilizando datos de distintos dominios y hardware, algo que antes era impensable”.

Datos masivos para preentrenamiento

Uno de los grandes avances del HPT es su capacidad para beneficiarse de un gran conjunto de datos preentrenados. Los investigadores compilaron más de 200,000 trayectorias de robots de diversas categorías, como videos de demostraciones humanas y simulaciones. Gracias a esta base de datos, los robots pueden aprender nuevas tareas con una cantidad mínima de datos específicos, acelerando el proceso de aprendizaje y permitiendo que se adapten a situaciones completamente nuevas.

Resultados destacados en simulaciones y tareas reales

En pruebas tanto simuladas como en entornos reales, el sistema HPT demostró un rendimiento superior en un 20% respecto a los métodos tradicionales de entrenamiento. Incluso cuando los robots enfrentaban tareas significativamente diferentes a los datos de preentrenamiento, lograron adaptarse y mejorar su desempeño, lo que indica un potencial real para robots de propósito general.

Ventajas del enfoque HPT: Escalabilidad y versatilidad

Este método permite entrenar robots con una “política única” que abarca múltiples configuraciones y modalidades de datos. David Held, profesor de la Universidad Carnegie Mellon, explicó que este avance permite a los métodos de aprendizaje de robots escalar enormemente, aprovechando datos de diversas fuentes y adaptándose a diseños de robots en constante evolución. Esta versatilidad podría llevar a una nueva era de robots que se ajustan a diferentes aplicaciones y contextos sin necesidad de reentrenamientos extensos.

Futuras mejoras y el sueño de un “cerebro robótico universal”

Los investigadores del MIT planean mejorar el sistema HPT explorando cómo una mayor diversidad de datos podría potenciar su rendimiento. A largo plazo, el equipo espera lograr un “cerebro robótico universal” que cualquier robot pueda descargar y utilizar sin entrenamiento adicional. Wang compartió su visión de un sistema similar a los modelos de lenguaje avanzados, donde la escalabilidad y la capacidad de adaptación son clave para su funcionalidad.

En wwwhatsnew.com, creemos que este tipo de desarrollos nos acercan a un mundo donde los robots no solo ejecutarán tareas, sino que podrán aprender continuamente de su entorno y responder a nuestras necesidades de una forma mucho más ágil e intuitiva. A medida que estos sistemas se optimicen, podríamos ver una generación de robots que colaboren con nosotros en diversas áreas, desde la atención al cliente hasta la investigación científica.