Un equipo conjunto de Adobe Research y la prestigiosa Universidad Nacional de Australia ha alcanzado un hito en el campo de la inteligencia artificial (IA). Han creado un modelo que transforma imágenes bidimensionales en modelos tridimensionales en un tiempo récord de cinco segundos, una hazaña que abre nuevas puertas a la creatividad y la producción digital en campos tan variados como la animación y el diseño industrial.
El trabajo de los investigadores, plasmado en el estudio «LRM: Large Reconstruction Model for Single Image to 3D«, se basa en una arquitectura de red neuronal transformadora. Este sistema de IA, con sus más de 500 millones de parámetros, ha sido entrenado con un millón de objetos 3D de las bases de datos Objaverse y MVImgNet, lo que le permite predecir campos de radiación neuronal (NeRF) de manera directa y eficaz.
La capacidad para crear modelos 3D de alta fidelidad a partir de simples imágenes planas tiene el potencial de cambiar significativamente la forma en que trabajan profesionales de numerosos sectores. Desde el desarrollo de videojuegos hasta el diseño de productos, pasando por experiencias inmersivas en realidades aumentada y virtual (AR y VR), las aplicaciones prácticas de esta tecnología son tan amplias como prometedoras.
A pesar de los impresionantes resultados, el modelo aún enfrenta desafíos, como la creación de texturas borrosas en áreas no visibles de los objetos. Sin embargo, esta limitación no resta importancia al avance que supone el LRM para el campo de la reconstrucción 3D generalizada.
La tecnología de reconstrucción 3D ha dado pasos agigantados desde sus inicios, y este proyecto de Adobe marca un punto de inflexión en la historia de la digitalización de objetos. La posibilidad de que cualquier persona pueda convertir una fotografía en un modelo 3D con su smartphone sugiere un futuro donde las barreras entre lo digital y lo tangible se desvanecen cada vez más.
Con LRM, Adobe está pavimentando una vía expresiva hacia una democratización sin precedentes del modelado 3D. La utilización de redes neuronales transformadoras, una arquitectura que refleja la complejidad del cerebro humano, destaca el impresionante crecimiento del aprendizaje automático. Este avance es comparable al salto de los procesadores de texto a la edición de texto en tiempo real: un cambio de paradigma en la creación y manipulación de contenido digital.
Para los aficionados a la impresión 3D, esto podría ser un antes y un después. Podríamos dibujar lo que queramos y transformarlo en una figura tridimensional lista para imprimir, el sueño de todo 3d_friki.
Más información en scalei3d.github.io/LRM.