La Inteligencia artificial interpreta ahora las tres dimensiones mucho mejor que antes

Publicado el

3d inteligencia artificial

Cuando se habla del 3D, el ojo humano esta capacitado para asimilar imágenes o escenas de este tipo, mas no así la inteligencia artificial.

Esto resulta un aspecto sobre el cual es necesario trabajar, ya que es necesario que una máquina pueda inferir propiedades sobre una escena 3D a partir de observaciones de imágenes 2D usadas durante la etapa de entrenamiento.

Si bien el uso de redes neuronales ha sido efectivo como método de aprendizaje automático para ayudar a las máquinas a generar representaciones de escenas 3Da partir de imágenes, estas no han sido lo suficientemente rápidas para expandir su viabilidad en diferentes aplicaciones del mundo real.

Sin embargo, un equipo de investigadores del MIT, en colaboración con miembros de otros centros, han logrado desarrollar una técnica capaz de representar escenas 3D a partir de imágenes a una velocidad 15 mil veces más rápida que la de algunos modelos vigentes en la actualidad.

Al referirnos a la técnica, esta representa una escena como un campo de luz de 360 grados, generada mediante una función que describe todos los rayos de luz en un espacio 3D, los cuales fluyen en cada punto y dirección dentro de la escena.

El campo de luz es codificado en una red neuronal, de manera que esta pueda ser usada luego para generar una representación mas veloz de la escena 3D subyacente a partir de una imagen bidimensional.

Denominadas por los investigadores como redes de campos de luz (LFN por sus siglas en inglés) estas son capaces de reconstruir un campo de luz tras efectuar la observación de una imagen, llevando también a cabo la renderización de escenas 3D a velocidades de cuadro en tiempo real.

Los investigadores involucrados en este proyecto esperan a futuro poder aumentar la robustez de su modelo a fin de implementarlo en escenas complejas del mundo real.

Para ello es necesario mejorar aún más la eficacia de los LFN, lo cual sería posible centrándose solamente en la reconstrucción de determinadas partes del campo de luz. Esto, de acuerdo con lo señalado por Vicent Sitzmann, postdoc del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL por sus siglas en ingles) y coautor del artículo.