Adaptan IA generadora de imágenes para hacerla compatible con animaciones 3D

Las redes antagónicas generativas son una clase de algoritmos que han hecho famosa a la inteligencia artificial, por los diversos ejemplos últimamente conocidos en los que se patenta su capacidad de generar imágenes similares a las de algún conjunto de datos predispuesto.

Extendiendo las capacidades hasta ahora atribuidas a estos sistemas, una nueva investigación presentó una modificación de StyleGAN2, una popular red antagónica generativa que principalmente se utiliza para generar rostros, adaptada para trabajar con gŕaficos en 3D.

Imágenes multiplano generativas: Generación de imágenes 3D mediante inteligencia artificial

Un proyecto reciente, desarrollado conjuntamente por investigadores de Apple y la Universidad de Illinois Urbana-Champaign, Estados Unidos, abordaron el problema de generar geometría 3D y su correspondiente textura a partir de imágenes de vista única.

Los investigadores basaron su trabajo en StyleGANv2, cuyo código fue liberado por Nvidia. Sobre este proyecto, desarrollaron una nueva rama generadora capaz de producir un conjunto de mapas alfa fronto-paralelos con un espíritu similar a las imágenes tridimensionales.

De acuerdo a lo señalado por los investigadores en la presentación de su proyecto, esta iniciativa sólo requirió de dos ajustes para conseguir que un modelo generativo 2D sea compatible con 3D.

En primer lugar, era necesario añadir una rama generadora multiplano a StyleGAN, para que pueda generar un mapa de profundidad en el plano construido. En segundo lugar, se requería también la implementación de un sistema discriminador condicionado por la pose, condicionado por la posición de la cámara.

Los investigadores tras este proyecto, denominan los productos generados por este sistema como “imágenes multiplano generativas” (Generative Multiplane Images, en inglés, o GMPI), que “no solo son de alta calidad, sino que también garantizan la coherencia de visualización, lo que hace que las GMPI sean diferentes de muchos trabajos anteriores”.

Los investigadores esperan que la simplicidad del método propuesto inspire trabajos futuros, para solucionar las limitaciones actuales asociadas a su aplicación.

Una serie de ejemplos, como los presentados en la imagen que acompaña a esta nota, pueden revisarse en acción, como vídeos, en el sitio web del proyecto. Se recomienda revisar aquel portal desde un ordenador, pues el procesamiento de las animaciones se realiza desde el navegador.