Hoy por hoy, los deepfakes no pasan desapercibidos. Estas piezas audiovisuales digitalmente intervenidas, suelen generar impresión en caso de estar bien logradas, dada la confusión que potencialmente desencadenan al no permitir con facilidad ser reconocidas como clips editados.
Aunque suele asociarse a la entretención e incluso a prácticas éticamente cuestionables, un clip deepfake también puede representar una oportunidad para potenciar alguna iniciativa que se valga del uso de recursos audiovisuales. Sin ir muy lejos, hace algunos meses repasamos en un artículo algunas ideas de negocios vinculadas a esta técnica, entre las que destaca la posibilidad de ofrecer varias versiones de un mismo clip, pero variando en el idioma de la narración, por ejemplo.
Para este tipo de proyectos, llega como alternativa Deep Word, una plataforma web capaz de crear videos totalmente artificiales en cosa de minutos. Gracias a que el material es procesado en los servidores de esta aplicación, se elimina la necesidad de contar con un equipamiento potente para generar este tipo de material. En palabras propias de la compañía, se perfilan como una alternativa para producir vídeos sin depender de una cámara.
Para producir un vídeo con Deep Word sólo se necesitan dos cosas: un clip en el que se vea claramente la persona que protagonizará el deepfake, idealmente sola, sin obstáculos en el campo visual, de frente y también, es necesario contar con una fuente de audio de la misma duración del vídeo, la cual puede estar registrada en cualquier idioma, pero debe ser grabada en la mejor calidad posible, sin ruidos ni variaciones exageradas de volumen. Puedes revisar en la misma página de Deep Word los lineamientos óptimos para seleccionar este contenido.
Si no cuentas con una fuente de vídeo para usar de base, puedes acceder a una galería de actores disponible para revisar desde la misma plataforma. De igual forma, si no tienes en tu poder el fragmento de audio necesario, puedes generarlo mediante un motor de procesamiento de texto a voz integrado en la aplicación, aunque claramente sacrificando calidad y credibilidad.
Deep Word asegura contar con la capacidad de sincronizar los movimientos de los labios y la mandíbula de quien protagonice el clip con el audio seleccionado previamente. Por lo general, el proceso de edición toma entre 5 y 10 minutos. Una vez finalizado, el resultado se notifica mediante un mensaje a través de correo electrónico.
Dado que el producto a obtener se construye gracias a la obra de un sistema automatizado, los resultados podrían presentar algunas fallas de vez en cuando, como una sincronización deficiente del movimiento de los labios y mandíbula. Ante esto, se puede solicitar una revisión manual del vídeo generado a través del botón “feedback” de la aplicación. Mediante este canal, el equipo de Deep Word revisará las fuentes de audio y vídeo utilizadas y en caso de no infringir los lineamientos de contenido sugeridos, se restituirá a la cuenta respectiva un cupo en su saldo mensual para volver a generar un clip.
Este servicio se encuentra disponible gratuitamente, pero con algunas limitaciones. La calidad máxima de exportación es de 720p, la duración máxima es de un minuto y hay un tope para generar hasta 5 clips al mes, los cuales se exportarán con el logo de Deep Word en una esquina. Para eliminar estas restricciones, hay disponibles planes de suscripción con renovación mensual y sus tarifas van desde los $14.99 USD.
Más demostraciones, explicaciones y detalles sobre el funcionamiento de esta app, están disponibles en el sitio web de la aplicación: DeepWord.co