Sobre la generación de vídeo usando Inteligencia Artificial

Publicado el

robot editando video

Los memes de video hechos con algoritmos están por todas partes. Su proliferación repentina puede augurar una explosión inminente en la capacidad de la tecnología.

En las últimas semanas, es probable que hayas notado algunos memes de video impresionantes hechos con inteligencia artificial (IA). La reimaginación de Harry Potter como un comercial de Balenciaga (tenéis el vídeo abajo) y el inquietante metraje de Will Smith comiendo espagueti se volvieron virales recientemente. Estos videos destacan cuán rápido está avanzando la capacidad de la IA para crear video, así como lo problemático que pueden ser algunos usos de la tecnología.

Los videos AI recuerdan el momento en que las herramientas de creación de imágenes de IA se generalizaron el año pasado, cuando programas como Craiyon (anteriormente conocido como DALL-E Mini) permitieron que cualquiera creara imágenes reconocibles, aunque crudas y a menudo surrealistas.

Craiyon era una imitación de código abierto del entonces cuidadosamente restringido generador de imágenes DALL-E 2 de OpenAI, la empresa detrás de ChatGPT. La herramienta fue la primera en mostrar la capacidad de la IA para tomar una sugerencia de texto y convertirla en lo que parecían ser fotos reales e ilustraciones dibujadas por humanos. Desde entonces, DALL-E se ha abierto a todos, y programas como Midjourney y Dream Studio han desarrollado y perfeccionado herramientas similares, lo que hace que sea relativamente trivial crear imágenes complejas y realistas con unos pocos toques en un teclado.

A medida que los ingenieros han ajustado los botones y palancas algorítmicos detrás de estos generadores de imágenes, han agregado más datos de entrenamiento y han pagado más chips GPU para ejecutar todo, estas herramientas de creación de imágenes se han vuelto increíblemente buenas para falsificar la realidad.

El acceso generalizado a esta tecnología, y su sofisticación, nos obliga a repensar cómo vemos las imágenes en línea, como se destacó después de que imágenes hechas con IA que pretendían mostrar el arresto de Donald Trump se volvieran virales el mes pasado. El incidente llevó a Midjourney a anunciar que ya no ofrecería una prueba gratuita de su servicio, una solución que podría disuadir a algunos actores malintencionados tacaños, pero deja el problema más amplio sin resolver.

Aunque los algoritmos aún tienen dificultades para generar videos convincentes a partir de una sugerencia, están mejorando mucho más en la edición de videos. El meme de Balenciaga, junto con versiones que hacen referencia a Friends y Breaking Bad, se crearon combinando algunas herramientas de IA diferentes, primero para generar imágenes fijas y luego para agregar efectos de animación simples. Pero el resultado final sigue siendo impresionante.

Un punto de inflexión para la creación de video

Runway ML, una startup que desarrolla herramientas de IA para la creación y edición de imágenes y videos profesionales, lanzó esta semana una nueva técnica más eficiente para aplicar cambios de estilo a los videos.

Técnicas de aprendizaje automático diferentes abren nuevas posibilidades. Una empresa llamada Luma AI, por ejemplo, está utilizando una técnica conocida como campos de radiación neuronal para convertir fotografías en 2D en escenas 3D detalladas.

Estos clips sugieren que estamos en un punto de inflexión para la creación de video de IA. Como con la generación de imágenes de IA, una creciente avalancha de memes podría ser seguida por mejoras significativas en la calidad y controlabilidad de los videos de IA que colocan la tecnología en todo tipo de lugares. La IA bien podría convertirse en musa para algunos autores. Las herramientas de Runway fueron utilizadas por los artistas de efectos visuales que trabajan en la película ganadora del Oscar Todo a la vez en todas partes. Darren Aronofsky, director de La ballena, El cisne negro y Pi, también es fanático de Runway.

Pero solo necesitas ver lo avanzadas que están las imágenes de Midjourney y Dream Studio ahora para sentir hacia dónde se dirige la creación de video de IA y lo difícil que puede ser distinguir clips reales de falsos. Por supuesto, las personas ya pueden manipular videos con tecnología existente, pero aún es relativamente costoso y difícil de lograr.