PALM-SayCan, inteligencia artificial para los robots de ayuda en el hogar

Es muy importante que los robots diseñados para ayudar en el hogar puedan entender e interpretar correctamente las órdenes humanas, y para ello se están usando modelos de lenguaje a gran escala, para evitar que se realicen acciones inapropiadas o peligrosas.

De momento el riesgo no es muy alto, pero imaginad la escena en un futuro cercano: un humano le dice a un robot que le ayude a apagar un electrodoméstico, y el robot decide romperlo para acabar antes, algo que podría ocurrir en algunos idiomas cuando el verbo apagar puede tener significados más flexibles que en castellano.

El caso es que los investigadores de Everyday Robots están trabajando en el tema junto con Google Research. Ambas empresas son propiedad de Alphabet. Para ello han creado ‘SayCan’, modelos de lenguaje con base en el mundo real en habilidades previamente entrenadas para desarrollar el modelo PaLM, o Pathways Language Model. Al combinarlos, tenemos PaLM-SayCan, una forma de simplificar las comunicaciones entre humanos y robots.

Lo fundamental es conseguir que los robots entiendan el contexto de la pregunta que le haga un humano, y que responda en función del entorno.

De momento se ha probado PALM-SayCan con un robot en un ambiente de cocina. Cuando el investigador pide «derramé mi bebida, ¿puedes ayudarme?», el robot no sugiere nada, simplemente regresa con una esponja y aprende con la experiencia. Con modelos tradicionales, el robot podría responder con cosas como «una aspiradora podría ser útil», sin realizar ninguna acción, ya que «ayuda» puede significar muchas cosas diferentes.

Hay un artículo, titulado «Haz lo que yo podría hacer, no lo que digo«, donde Google explica cómo estructuran las capacidades de planificación del robot para identificar una de sus ‘habilidades’ en función de una instrucción de alto nivel de un ser humano, y luego evalúan la probabilidad de que cada habilidad posible sea para el cumplimiento de la instrucción.

Cuando reciben una instrucción de un humano, SayCan combina las probabilidades de un modelo de lenguaje con las probabilidades de realizar una acción, y eso se repite hasta que hay éxito en el proceso.