Cómo se hacen los vídeos de gente diciendo lo que nunca ha dicho

deepfakes

Seguramente todos vosotros habréis visto alguna vez algún vídeo en el que el rostro de un famoso o famosa pronuncia palabras que en realidad nunca salieron de su boca. Esos deepfakes son cada vez más populares, y forman uno de los pilares de las fake news: basta un político diciendo algo en un vídeo gracias a la edición, y ya tenemos la noticia falsa lista para crear confusión en todas las redes sociales.

El caso es que nunca fue muy difícil hacer algo así, basta con separar la boca del resto del rostro y crear un vídeo con los movimientos de dicha boca editados para que parezcan pronunciar cualquier cosa. Pero ahora el asunto se está poniendo tan fácil que da algo de miedo.

Existe un software basado en aprendizaje automático que permite crear estos vídeos sin necesidad de editarlos. Solo tenemos que escribir las palabras que queramos que el rostro pronuncie, y el sistema se encargará de hacer todo el trabajo. Es el resultado de un trabajo realizado por investigadores de la Universidad de Stanford, el Instituto Max Planck de Informática, la Universidad de Princeton y Adobe Research, y lo podéis ver en funcionamiento en el vídeo superior.

El programa se encarga de “leer” el texto que le indicamos y de producir un vídeo realista modificando el diálogo de quien habla. Podemos coger el rostro de un político hablando en Youtube, escribir una frase completamente diferente de lo que está diciendo y obtener el resultado para crear la fake new deseada.

La plataforma escanea el vídeo de la víctima y aisla los fonemas que pronuncia, de forma que sabe la posición de su boca cuando dice una u otra sílaba. Una vez tiene una base de datos de posiciones de boca, crea un modelo tridimensional de la mitad inferior de la cara, y ahora solo tiene que leer la frase de entrada para crear el vídeo falso.

De las 138 personas a las que preguntaron sobre el resultado, el 60% no supo diferenciar si era un vídeo falso o real, un porcentaje que puede ir aumentando durante los próximos meses.

Por supuesto, este programa no está disponible de forma pública, pero no tardaremos mucho en ver algo así a la distancia de un click.

Podéis leer más detalles sobre esta técnica en The Verge.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.