Inteligencia Artificial y Robótica en 2024: Nuevas estrategias de Google DeepMind

Publicado el

robotica

2024 se perfila como un año de gran relevancia, particularmente en el ámbito de la inteligencia artificial (IA) y la robótica. Google DeepMind Robotics, un equipo en la vanguardia de este campo, ha anunciado recientemente desarrollos notables en su blog, desarrollos que me gustaría compartir con vosotros.

Estamos hablando de avances significativos que prometen mejorar la forma en que los robots interactúan y comprenden el mundo: AutoRT, SARA-RT y RT-Trajectory. Estos desarrollos representan un gran avance en la inteligencia artificial aplicada a la robótica.

Uno de los proyectos más destacados es AutoRT, un sistema diseñado para mejorar la manera en que los robots comprenden y ejecutan tareas. Este avance es crucial, considerando que hasta ahora, los robots se han limitado a realizar tareas singulares y repetitivas. AutoRT, utilizando modelos fundamentales de gran tamaño y un Modelo de Lenguaje Visual (VLM), permite a los robots interpretar mejor su entorno y coordinar acciones entre ellos. Imaginad una flota de robots trabajando juntos de manera armónica, manejando hasta 52 dispositivos diferentes. Esta capacidad de gestionar múltiples tareas y adaptarse a cambios imprevistos podría transformar sectores como la manufactura y la logística.

Otro desarrollo fascinante es RT-Trajectory, que introduce un método de entrenamiento basado en videos. Al utilizar plataformas como YouTube, los robots pueden aprender de una amplia gama de situaciones reales. Lo que me parece particularmente interesante es cómo RT-Trajectory superpone esquemas en dos dimensiones sobre los videos para proporcionar pistas visuales a los robots. Este enfoque ha duplicado la tasa de éxito en las pruebas, alcanzando un impresionante 63% en comparación con el 29% del entrenamiento RT-2. Es evidente que estamos presenciando una evolución significativa en la precisión y eficiencia de los robots. Por ejemplo, puede ayudar a un robot a entender mejor cómo «limpiar una mesa» al proporcionarle un esquema detallado del movimiento requerido. Esto no solo mejora la capacidad de los robots para generalizar tareas nuevas, sino que también aumenta la tasa de éxito en la ejecución de tareas. Solamente espero que elijan bien los vídeos de Youtube a partir de los cuanles se entrenan.

En cuanto a SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers), esta nueva metodología transforma los modelos de Transformers en versiones más eficientes. Lo más impresionante de SARA-RT es su capacidad para convertir la complejidad cuadrática en lineal, lo que se traduce en una reducción significativa de los requerimientos computacionales. Este avance no solo mejora la velocidad de los modelos originales, sino que también preserva su calidad. Es una herramienta potencialmente revolucionaria para la escalabilidad de la tecnología Transformer.

Para ilustrar mejor cómo funciona SARA-RT, vamos a imaginar un ejemplo práctico en un entorno industrial:

Ejemplo de SARA-RT en un entorno de fabricación

Contexto: En una fábrica de automóviles, hay una serie de robots encargados de ensamblar diferentes partes de los vehículos. Estos robots utilizan el modelo de control RT-2, basado en la arquitectura de Transformers, para interpretar instrucciones complejas y realizar tareas de ensamblaje precisas.

Desafío: Los modelos RT-2, aunque son avanzados, enfrentan limitaciones en términos de velocidad de procesamiento debido a la complejidad computacional de sus módulos de atención. Esta limitación se hace evidente cuando los robots necesitan procesar un gran volumen de datos sensoriales o realizar tareas que requieren una rápida toma de decisiones.

Implementación de SARA-RT: Para superar estos desafíos, se decide implementar SARA-RT en estos robots. SARA-RT utiliza un método de «up-training», que convierte la complejidad cuadrática de los modelos Transformers en lineal. Esto significa que, incluso si la cantidad de datos sensoriales se duplica, el aumento en los recursos computacionales requeridos no es tan drástico como antes.

Resultados:

  • Mejora en la Velocidad de Procesamiento: Con SARA-RT, los robots pueden procesar la información sensorial más rápidamente. Esto es crucial en un entorno de fábrica donde cada segundo cuenta.
  • Mantenimiento de la Calidad: A pesar del aumento en la velocidad, la calidad de las decisiones y la precisión de las tareas de los robots no se ven comprometidas. Los robots siguen siendo capaces de realizar tareas complejas de ensamblaje con la misma eficacia.
  • Incremento en la Producción: La fábrica observa un incremento en la eficiencia de la línea de ensamblaje. Los robots pueden adaptarse más rápidamente a cambios en las instrucciones de ensamblaje o a diferentes modelos de vehículos.
  • Reducción de Costes Operativos: Al ser más eficientes, los robots reducen el tiempo y los recursos necesarios para completar las tareas, lo que a su vez reduce los costos operativos.

Estas innovaciones optimizan el rendimiento de los robots actuales aprovechando datos existentes de manera más efectiva. El potencial de estos desarrollos en campos como la atención sanitaria y el servicio al cliente es enorme, abriendo la puerta a un futuro donde los robots son más intuitivos, adaptables y accesibles.

 

El artículo donde explican los detalles se encuentra en deepmind.google

Comparte en: