WWWhat's new

HuGE, así es el nuevo aprendizaje de robots creado en el MIT y en Harvard

robots

Un equipo de investigadores de prestigiosas instituciones como el MIT, Harvard y la Universidad de Washington ha desarrollado un método pionero para el entrenamiento de agentes de inteligencia artificial (IA) y robots. Conocido como Human Guided Exploration (HuGE), este enfoque se destaca por utilizar la retroalimentación humana para guiar el aprendizaje de los robots, rompiendo con los métodos tradicionales que dependen exclusivamente de expertos en IA.

A diferencia de las técnicas convencionales de aprendizaje por refuerzo, que requieren funciones de recompensa meticulosamente diseñadas por especialistas, HuGE adopta una estrategia más inclusiva y accesible. La retroalimentación multitudinaria, obtenida de usuarios no expertos a nivel global, se convierte en la brújula que orienta el aprendizaje de los robots. Esta innovación no solo simplifica el proceso de enseñanza de tareas complejas, sino que también lo hace más eficiente y adaptable a diferentes contextos.

La clave de HuGE radica en su capacidad para filtrar y aprovechar incluso datos imprecisos o «ruidosos», algo común en la retroalimentación proporcionada por no expertos. En lugar de percibir estos errores como un obstáculo, HuGE los utiliza para guiar al robot hacia un aprendizaje más efectivo y rápido. Este enfoque asincrónico permite que personas de diversas partes del mundo contribuyan al entrenamiento de los robots, superando barreras geográficas y de conocimiento especializado.

Principios y funcionamiento de HuGE

HuGE se basa en principios de aprendizaje por refuerzo, un enfoque donde los agentes aprenden a través de la experimentación y la obtención de recompensas. Sin embargo, HuGE transforma este concepto al introducir la retroalimentación humana como un factor clave. Este sistema se compone de dos partes fundamentales:

Una característica distintiva de HuGE es su capacidad para funcionar incluso sin retroalimentación continua. Si no hay retroalimentación o si esta tarda en llegar, el agente sigue aprendiendo de forma autónoma, aunque a un ritmo más lento. Este aspecto de HuGE permite que la retroalimentación se recopile de manera infrecuente y asincrónica, lo que facilita la participación global y diversa.

Por otro lado, dado que la retroalimentación solo guía sutilmente el comportamiento del agente, este puede aprender a completar la tarea incluso si los usuarios proporcionan respuestas incorrectas. La tolerancia a errores y datos «ruidosos» es fundamental para este enfoque, permitiendo un aprendizaje más flexible y resistente a las imperfecciones humanas.

Experimentos y resultados

Los investigadores llevaron a cabo una serie de experimentos tanto en entornos simulados como en situaciones del mundo real para probar la eficacia de HuGE. Estos experimentos demostraron la capacidad del método para adaptarse y aprender en diversos contextos y tareas.

Ha quedado claro, de esta manera, que la capacidad de HuGE para aprender de manera eficiente a partir de datos imperfectos y su adaptabilidad a distintos contextos lo convierten en una herramienta potencialmente transformadora en la educación y entrenamiento de IA y robots.

Aplicaciones y potencial de HuGE

El desarrollo de HuGE marca un punto de inflexión en el campo del aprendizaje robótico y de la inteligencia artificial. Este método abre un abanico de posibilidades para aplicaciones futuras, tanto en entornos industriales como en la vida cotidiana.

Así que ya véis, HuGE no solo representa un avance técnico, sino que también ofrece una visión de un futuro donde los robots y la IA pueden aprender de manera más humana, integrándose de manera más natural y efectiva en nuestras vidas.

Podéis leer más sobre el tema en news.mit.edu