Alibaba revoluciona la generación de videos con su modelo de IA Wan2.1

Publicado el

Una vibrante ilustración de arte pop que representa la traducción de video con colores llamativos y elementos de transformación digital, inspirada en la estética clásica del cómic.

La inteligencia artificial sigue avanzando a pasos agigantados en el campo de la generación de contenido, y ahora Alibaba ha dado un golpe sobre la mesa con la publicación de su modelo Wan2.1, una alternativa open source a las soluciones de video-generación de gigantes como OpenAI y Google.

Un modelo de video-generación al alcance de todos

Alibaba ha liberado cuatro versiones de Wan2.1, permitiendo a los usuarios descargar y ejecutar estos modelos de manera gratuita en ordenadores con la capacidad adecuada. Este desarrollo busca democratizar el acceso a herramientas de inteligencia artificial para la creación de contenido audiovisual.

El modelo destaca por su capacidad para manejar movimientos complejos, mejorar la calidad de los píxeles y optimizar la precisión de ejecución de instrucciones. Estas mejoras lo convierten en una opción atractiva para empresas y creadores de contenido que desean explorar nuevas formas de producción visual.

Comparación con OpenAI Sora y Google Veo 2

La llegada de Wan2.1 supone una alternativa a Sora de OpenAI, que forma parte del plan de suscripción ChatGPT Plus con un costo de $20 al mes, con límites de generación de videos en resoluciones de hasta 720p. Otra opción disponible es Veo 2 de Google, aunque por ahora está limitado a usuarios selectos.

Los modelos de Wan2.1 oscilan entre 1.3 y 14 mil millones de parámetros, lo que permite generar videos de varios segundos en resoluciones de hasta 720p. Aún no se ha confirmado si Alibaba lanzará una versión capaz de generar contenido en 1080p o superior.

El potencial y las limitaciones de la IA de video

Aunque la IA de generación de video tiene un enorme potencial, también enfrenta desafíos significativos. Según el analista Jack Gold, estos modelos aún están en una fase incipiente, comparándolos con los procesadores de texto de los años 80, que evolucionaron con el tiempo.

Desde WWWhatsnew creemos que la revolución de la generación de videos por IA está en un punto similar al de los primeros programas de edición de imagen. Hoy en día, nadie se imagina trabajar sin herramientas como Photoshop o Premiere Pro, y en el futuro podríamos ver algo similar con estos modelos de IA.

Por otro lado, hay una preocupación creciente por la seguridad y el uso malintencionado de estos modelos, especialmente en la creación de deepfakes y contenido engañoso. Según Karl Freund, de Cambrian AI Research, estos modelos representan una oportunidad para la industria creativa, pero también abren la puerta a riesgos de desinformación.

Alibaba y la competencia en el mercado de la IA

China ha estado apostando fuerte por la inteligencia artificial, y empresas como Alibaba, Tencent y Baidu han logrado avances significativos en el campo. La llegada de Wan2.1 es una muestra del creciente liderazgo chino en la IA generativa.

Ejemplos previos como el chatbot DeepSeek han demostrado el potencial de la investigación china en IA. Ahora, con Wan2.1, Alibaba busca posicionarse como un referente en generación de video, compitiendo directamente con empresas como OpenAI, Google, Amazon y Microsoft.

Según Matt Garman, CEO de Amazon Web Services, los clientes buscan una variedad de modelos para diferentes necesidades. “No hay un modelo perfecto para todos los casos de uso, y es probable que veamos cada vez más opciones disponibles”, afirmó en una publicación reciente en LinkedIn.

El futuro de la IA en generación de video

Desde WWWhatsnew creemos que este es solo el comienzo de una revolución en la producción de video. A medida que estos modelos se perfeccionen, podríamos ver avances que permitan la generación de contenido cinematográfico, anuncios publicitarios y videos educativos con una calidad que rivalice con la producción tradicional.

La posibilidad de que plataformas como YouTube, TikTok o Instagram integren estos modelos para facilitar la creación de contenido podría cambiar por completo la forma en que consumimos y producimos videos en línea.

Mientras tanto, la disponibilidad de Wan2.1 en plataformas como Hugging Face y Model Scope abre la puerta a una nueva ola de experimentación en la comunidad de desarrolladores y creadores.