Cuando se trata de inteligencia, artificial, redes neuronales y machine learning han sido notables los esfuerzos que se han llevado a cabo estos últimos años en el desarrollo de tecnologías basada en estos conceptos, generando interesantes resultados como un medicamento para eliminar bacterias mortales, una aplicación que resume textos o una web generadora de ritmos únicos.
No obstante, ha sido en el tratamiento de imágenes de rostros donde estos conceptos han dejado en evidencia su gran potencial, ya sea para reconocerlos o bien para generarlos de forma automática.
Y es que el procesamiento automatizado de imágenes de rostros se ha visto fuertemente impulsado gracias al desarrollo de las redes neuronales artificiales, las cuales han sido sustentadas a través de las fotos y selfies compartidas en las redes sociales u otros medios a lo largo del tiempo.
Gracias a esta acción se ha logrado recopilar una vasta cantidad de fotos de rostros, las cuales han sido usadas como recurso para entrenar a las IA, logrando así resultados increíbles, como una aplicación móvil con función para envejecer el rostro de una persona joven artificialmente consiguiendo un efecto realista o una amplia galería de rostros de personas que no existen.
No cabe duda que todo esto representa un gran avance para la fotografía de archivo. Sin embargo, un nuevo experimento sigue dando muestra de la capacidad que posee esta tecnología en lo que respecta a la generación de rostros.
Se trata de la iniciativa del artista alemán Mario Klingemann, miembro de Google Arts & Culture, notable por el uso de redes neuronales, códigos y algoritmos en sus obras quien se dio a la tarea de usar redes neuronales artificiales para generar rostros falsos al compás de una pieza musical, dando como resultado un video que podrás tener la oportunidad de ver aquí abajo.
Para lograrlo Klingemann recurrió al uso de algo denominado red de confrontación generativa StyleGAN2, herramienta de código abierto desarrollada por Nvidia y lanzada hace más de un año en la que Klingemann solo realizó algunos ajustes sobre los resultados de salida para adecuarlos al espectro de sonido generado por la canción Triggernometry de Kraftamt, el archivo de audio utilizado.
El resultado obtenido ha hecho que algunos seguidores de Klingemann en Twitter le pidieran revelar los valores de salida más extremos del StyleGAN2 con los cuales obtuvo algunos de los perturbadores rostros distinguibles a través del cuadro a cuadro en los momentos donde la canción alcanza su mayor intensidad.
Some of these frames have me dying from laughter and also horror 😂 but damn that’s amazing! pic.twitter.com/ynY4gfFqSu
— Neolucky (@_Yewon_) March 30, 2020