La IA ha llegado a prácticamente todos los rincones de nuestras vidas, pero hay una promesa que está tardando en llegar, la de los vehículos autónomos.
La tecnología está prácticamente lista, las leyes se están adaptando en muchos lugares del mundo, y la promesa de más cargadores eléctricos y de más interacción entre coches de diferentes autonomías está encima de la mesa, pero aún falta mejorar el cerebro de esos coches.
El caso es que hay una empresa llamada Waabi que está trabajando con la inteligencia artificial generativa para anticipar los movimientos del tráfico. Y no solo de los vehículos, sino también de peatones, ciclistas y cualquier elemento que comparta la vía.
La tecnología que está detrás de esta proeza lleva por nombre Copilot4D. Este sistema se nutre de una inmensa cantidad de datos recopilados a través de sensores lidar. Para quienes no estén familiarizados, lidar es una técnica que utiliza la luz para medir distancias. Imaginad poder anticipar cómo se moverán los autos y los transeúntes alrededor de un vehículo que se incorpora imprudentemente a una autopista. Esa es la promesa de Copilot4D.
El núcleo de Copilot4D, según leemos en el MIT, se asemeja mucho a los generadores de imágenes y videos, como Midjourney, DALL-E o Sora de OpenAI. Divide nubes de puntos de datos lidar —que básicamente son mapas 3D del entorno— en segmentos para luego, basándose en su entrenamiento, predecir el movimiento futuro de estos puntos. Al hacer esto de manera continua, Copilot4D puede proyectar lo que sucederá en los próximos 5 a 10 segundos.
La filosofía de Waabi, y de su CEO Raquel Urtasun, se centra en un diseño que aprende directamente de los datos. Esto contrasta con los sistemas tradicionales que dependen de instrucciones específicas para reaccionar ante situaciones particulares. Esta estrategia de «IA primero» podría minimizar las horas necesarias de pruebas en carretera, un tema de debate especialmente candente después de algunos accidentes recientes implicando vehículos autónomos.
Una distinción crucial de Waabi frente a sus competidores es su enfoque en el lidar en lugar de en cámaras. La razón es simple: aunque las cámaras pueden captar lo que ocurre alrededor, el lidar ofrece una medida precisa de las distancias y una mejor comprensión de la geometría del entorno. Esta capacidad es fundamental para alcanzar un nivel de automatización 4, donde el vehículo opera de forma segura sin necesidad de intervención humana.
Un punto que no se puede ignorar es el debate sobre si hacer públicos estos modelos. Liberar el código de Copilot4D permitiría una evaluación independiente de su seguridad y podría acelerar el avance en el campo. Sin embargo, también posibilitaría que los competidores tengan acceso a estos desarrollos. Waabi ha compartido detalles sobre la creación del modelo en una publicación, pero mantiene su código en reserva. Me parece una decisión inteligente, lo último que necesitamos son hackers atacando a los lidar de unos coches que van circulando con pasajeros dentro.
Esta capacidad de prever y adaptarse a las condiciones cambiantes del tráfico con una precisión de segundos podría ser el diferenciador que haga que la conducción autónoma pase de ser una tecnología prometedora a una realidad cotidiana segura y confiable.