Camera AI, para crear deepfakes en tiempo real con el navegador web

Publicado el

deepfakes

Hoy en día queda claro que no podemos fiarnos de nada de lo que vemos u oímos, pero solo estamos con los primeros pasos en lo que se refiere a la creación de contenido con IA, el mundo de las fake news y de los deepfakes está solo comenzando.

Una prueba es lo que consiguen hacer en www.fal.ai/camera, una cámara online en la que solo tenemos que poner, en el campo de texto, la persona a la que queremos parecernos, y comenzará a generar vídeo en tiempo real mientras movemos nuestra cabeza.

En este vídeo tenéis una demostración que he hecho:

 

La compañía responsable por esta solución está especializada en APIs de Stable Diffusion en Tiempo Real, que utilizan Modelos de Consistencia Latente (LCM). Recientemente, fal ha lanzado APIs que aprovechan los LCM para generar imágenes en un abrir y cerrar de ojos, específicamente en unos impresionantes 150 milisegundos. Esto es un gran salto desde los 10 segundos habituales de la Stable diffusion tradicional.

La velocidad de estas APIs ya ha permitido la creación de aplicaciones demostrativas como fal.ai/dynamic, o la cámara que veis arriba. En colaboración con ilumine AI, han desarrollado el espacio LCM-Painter en HuggingFace, que ha alcanzado una gran popularidad. Además, hemos experimentado con implementaciones en herramientas de diseño como Figma y tldraw, demostrando la versatilidad de esta tecnología.

El acceso a estas APIs se realiza a través de una interfaz API REST, notable por su simplicidad y eficacia. Se basa en solicitudes POST con datos en formato JSON. Este método facilita a los desarrolladores integrar la generación de imágenes en sus aplicaciones, abriendo un abanico de posibilidades creativas. Para una integración aún más sencilla, fal ofrece un cliente JavaScript. Este cliente simplifica enormemente la interacción con los endpoints de la API, permitiendo a los desarrolladores concentrarse en la creatividad y la innovación.

Para alcanzar una mayor eficiencia, han explorado también el uso de WebSockets, una tecnología que permite una comunicación bidireccional en tiempo real entre el cliente y el servidor. Esto puede incrementar significativamente la velocidad de generación de imágenes, alcanzando entre 3 y 5 cuadros por segundo.

Estamos ante herramientas que tienen el potencial de cambiar la forma en que interactuamos con la tecnología en nuestro día a día. Imaginad artistas creando obras en tiempo real, diseñadores modificando prototipos al instante o educadores utilizando imágenes generadas para ilustrar conceptos complejos. Estamos ante un cambio significativo en la creación digital.

Comparte en: