Cómo la IA de un coche autónomo puede predecir el comportamiento humano

Es difícil predecir el comportamiento de un conductor humano. Si bien el conductor podría conducir rápido cuando lleve a un ser querido al hospital, podría estar más relajado al regresar. En este sentido, la Conducción Autónoma también se complica, porque interactúa con diversos humanos en diversas condiciones.

Si los algoritmos de diferentes vehículos pudieran aprender de la interacción con otros coches autónomos y del conductor, sería una forma efectiva para que los algoritmos de estos vehículos aprendan. Este aprendizaje se conoce como aprendizaje federado cuando se realiza a través de una red basada en la nube sin comprometer los datos del controlador privado.

Aprendizaje federado personalizado de modelos de predicción de conductores para la conducción autónoma

Bajo aquel nombre, los científicos Manabu Nakanoya, Junha Im, Hang Qiu, Sachin Katti, Marco Pavone y Sandeep Chinchali han discutido este tema en un trabajo de investigación.

l aprendizaje federado personalizado de los modelos de predicción de controladores mejoraría el aprendizaje de los algoritmos de los coches autónomos y su adaptación sería mucho más rápida. Si los algoritmos aprendieran unos de otros, preservar la privacidad del conductor es la quintaesencia. Además, la información patentada de los algoritmos debe protegerse de otras compañías. Este trabajo de investigación propone APFL que permite a los algoritmos aprender unos de otros sin divulgar detalles personales.

Federal Learning (o FL) entrena un modelo localmente en el dispositivo del usuario (por ejemplo, un robot) y comparte actualizaciones de parámetros del modelo con un servidor central para aprender de diversos usuarios al tiempo que protege la privacidad al no cargar datos de entrenamiento sin procesar. El problema con la FL tradicional es que no permite un entrenamiento de datos efectivo debido a la naturaleza diversa de la interacción humano-robot.

El trabajo de investigación propone un FL adaptativo y personalizado (APFL) que supera estos desafíos y utiliza una tasa de aprendizaje basada en parámetros. La siguiente imagen del trabajo de investigación proporciona una breve comprensión de varios algoritmos de entrenamiento.

La primera contribución de esta investigación es mostrar los inconvenientes y el potencial de la FL personalizada estándar a través de un estudio de caso, donde los modelos robóticos comparten una estructura común para funciones dinámicas pero de costo heterogéneas.

Otra contribución destacada es la propuesta de un algoritmo novedoso que mitigue estos inconvenientes y aproveche efectivamente el conocimiento local y global para mejorar el control robótico. Específicamente, se demostró un fuerte rendimiento experimental de nuestro algoritmo en simuladores de conducción de última generación con datos reales del conductor humano.

En trabajos futuros, el equipo de investigación planea probar su algoritmo en implementaciones a gran escala de AV, utilizando una combinación de conjuntos de datos de trayectoria pública de servicios como Waymo, Aptiv, Lyft, entre otros. Además, se propone la entrega garantías de convergencia teórica para el algoritmo FL personalizado, en configuraciones de optimización convexa distribuida que surgen en sistemas multiagente y robóticos.

En general, esta investigación marca un primer avance concreto para abordar cómo aprender modelos de aprendizaje profundo especializados y conservadores de la privacidad para flotas de robots que interactuarán cada vez más con diversos humanos en diversos escenarios operativos.