Nvidia ha mostrado el potencial de su nuevo sistema de IA, que hará que te veas presentable cuando aparezcas en pijama y con el cabello revuelto en una videollamada.
Un modelo de inteligencia artificial que puede dar vida a una simple fotografía para que se convierta en tu mejor versión en una videoconferencia.
El año pasado, Nvidia presentó Maxine, su nueva plataforma de inteligencia artificial con muchísimas aplicaciones para mejorar la experiencia en las videollamadas. Y ahora, en una nueva demostración deja ver el potencial de uno sus modelos de Aprendizaje Profundo, Vid2Vid Cameo.
el modelo se entrenó utilizando un conjunto de datos de 180.000 videos de «talking head» de alta calidad. La red aprendió a identificar 20 puntos clave que se pueden usar para modelar el movimiento facial sin anotaciones humanas. Los puntos codifican la ubicación de las características, incluidos los ojos, la boca y la nariz.
Así que para iniciar este proceso, solo es necesario elegir una imagen, que puede ser una fotografía o avatar, para que la IA la tome como referencia cuando genere la transmisión de videoconferencia. Cuando el usuario se una a la reunión, la IA capturará en tiempo real todos sus movimientos y expresiones faciales, y los aplicará a la imagen 2D cargada como referencia.
Sí, es como si tu fotografía cobrará vida duranta la videollamada. Así que, por ejemplo, si estuvieras por unirte a una videoconferencia de negocios, podrías cargar una fotografía con un atuendo acorde a ese escenario, o si es una reunión más informal, podrías optar por un avatar.
Y no importa cómo te veas frente a la pantalla un lunes por la mañana, tu imagen lucirá perfecta gracias a la dinámica que propone la IA de Nvidia. Y este sistema tiene en cuenta otros escenarios:
Si el sujeto se gira hacia la izquierda, la tecnología puede ajustar el punto de vista para que el asistente parezca estar directamente frente a la cámara web […] Además de ayudar a los asistentes a la reunión a lucir lo mejor posible, esta técnica de inteligencia artificial también reduce el ancho de banda necesario para las videoconferencias hasta en 10 veces, evitando fluctuaciones y retrasos
Podemos ver una demostración de todas estas características en el vídeo que comparte el equipo de Nvidia: