Así es Kling, la competencia de Sora para crear vídeos a partir de texto

Publicado el

Kling

Kuaishou, una de las plataformas de videos cortos más populares en China, con más de 600 millones de usuarios activos, ha dado un paso gigante en la tecnología de inteligencia artificial. El 6 de junio de 2024, lanzaron Kling, un innovador modelo de IA generativa de texto a video disponible para el público. Este avance promete transformar la manera en que se crean videos para plataformas como TikTok.

Primeras pruebas con Kling

En MIT tuvieron la oportunidad de probar Kling. La experiencia de acceso no fue sencilla: descargaron la herramienta de edición de videos de Kuaishou, se registraron con un número chino, esperaron en una lista de espera y completaron un formulario adicional. Aunque Kling no procesa bien los prompts en inglés, se puede solucionar traduciendo al chino o incluyendo algunas palabras chinas.

Resultados de las pruebas

Aquí algunos de los videos que generaron con Kling (los podéis ver en el enlace que he puesto antes):

  • Tokio nevada y bulliciosa: La cámara se mueve por las calles de Tokio, capturando a personas disfrutando del clima nevado y comprando en puestos callejeros. Pétalos de sakura y copos de nieve vuelan en el aire.
  • Mujer elegante en Tokio: Una mujer con chaqueta de cuero negra y vestido rojo camina por una calle llena de neones brillantes. La calle húmeda refleja las luces coloridas.
  • Gato atigrado en un jardín: Un gato atigrado blanco y naranja corre felizmente por un jardín denso, explorando ramas, flores y hojas.

Ventajas y limitaciones de Kling

Los videos generados por Kling son bastante fieles a los prompts y las físicas parecen correctas. El tiempo de generación es aceptable, alrededor de tres minutos por video. Sin embargo, existen limitaciones notables:

  • Calidad de video: Los videos, aunque tienen una resolución de 720p, son granulados y borrosos.
  • Duración: Limitados a cinco segundos, lo que reduce su dinamismo.
  • Fidelidad a los prompts: A veces, Kling ignora elementos importantes del prompt.

Comparación con otros modelos

Comparar Kling con modelos como Sora de OpenAI no es del todo justo. Las demostraciones de Sora suelen ser seleccionadas cuidadosamente para mostrar lo mejor. Los videos de Kling que generaron son resultados iniciales sin ajustes de ingeniería de prompts.

El impacto en la industria de videos cortos

La capacidad de Kling para generar videos cortos de alta calidad puede cambiar las reglas del juego en la industria de videos cortos. Según Shen Yang, profesor de Tsinghua University, esta tecnología tendrá un impacto significativo en cómo se crean y consumen los videos en plataformas como Kuaishou y Douyin (TikTok en China).

Futuro y competencia

El lanzamiento de Kling no es un caso aislado. Otras empresas están entrando en el campo de la generación de video con IA. Una semana después de Kling, la startup californiana Luma AI lanzó un modelo similar. Además, ByteDance, el principal rival de Kuaishou, está preparando su propia herramienta de video generativo. HAce pocos vimos lo que hace Dream Machine, y el resultado no es nada malo, y Runway también se está poniendo las pilas.