La generación de escenas tridimensionales a partir de fotografías ha sido durante años una meta ambiciosa en el campo de la inteligencia artificial. Sin embargo, los métodos existentes solían depender de conjuntos de datos muy controlados y limitados. Es decir, solo funcionaban bien con fotos tomadas desde múltiples ángulos, en condiciones de luz estables y sin demasiadas interferencias visuales. Pero el nuevo sistema WildCAT3D, desarrollado por un equipo liderado por la profesora Hadar Averbuch-Elor de Cornell Tech, cambia radicalmente ese panorama.
Este avance, presentado en la conferencia NeurIPS 2025 y publicado en arXiv, se centra en superar una de las principales barreras de la síntesis de vistas novedosas (NVS, por sus siglas en inglés): la falta de datos consistentes. A diferencia de los modelos anteriores, WildCAT3D puede aprender a partir de fotos tomadas por usuarios comunes, en condiciones reales, con todas las imperfecciones que eso conlleva. Continúa leyendo «Transformar fotos comunes en escenas 3D realistas ya es posible con WildCAT3D»