Así es como Google usa la IA para potenciar los Shorts de YouTube

Publicado el

El equipo de Google compartió un breve vídeo, que muestra cómo el modelo de lenguaje visual Flamingo de DeepMind trabaja para que los usuarios encuentren los YouTube Shorts relevantes para sus búsquedas.

Es una dinámica que trabaja en segundo plano para crear descripciones automáticas a millones de vídeos de formato corto. Te contamos los detalles.

Cómo trabaja la IA de Google para que encuentres Shorts relevantes en YouTube

Si bien los Shorts de YouTube son fáciles de crear y subir a la plataforma, los creadores no siempre se toman el trabajo de escribir títulos y descripciones que faciliten encontrarlos en la app.

En este contexto es donde modelo de lenguaje visual Flamingo sale al rescate para generar automáticamente descripciones de los millones de vídeos de formato corto:

Este modelo de Flamingo, la capacidad de comprender estos videos y proporcionarnos texto descriptivo, es realmente muy valioso para ayudar a nuestros sistemas que ya están buscando estos metadatos. Les permite comprender estos videos de manera más efectiva para que podamos hacer esa coincidencia para los usuarios cuando los buscan

No es una dinámica nueva que esté empleando Google, ya que conocemos su trabajo desde el año pasado, pero vale la pena darle un nuevo vistazo.

Dicho de forma simple, Flamingo analiza los cuadros iniciales del vídeo y explica lo que se ve en escena. Siguiendo el ejemplo que se muestra en la imagen de arriba, la descripción sería algo así como «un flamenco en la playa».

Sí, descripciones generadas por IA que describen lo que se muestra en los primeros fotogramas del vídeo. Ese texto se almacena en YouTube como metadatos para ayudar a categorizar los vídeos y que sean más fácil de encontrar analizando una serie de criterios.

O como menciona el equipo de Google «para hacer coincidir los resultados de búsquedas con las consultas de los espectadores». Es decir, este modelo de lenguaje visual trabaja en segundo plano, ajeno al trabajo del creador, y teniendo en cuenta las intenciones de búsqueda de los usuarios.

Por el momento, esta dinámica solo se está aplicando a los Shorts, pero el equipo de Google no descarta que se puede aplicar al resto de los vídeos. Sin embargo, en el caso de los vídeos de YouTube la dinámica es diferente.

Ya sabemos que los creadores se esfuerzan por agregar títulos, descripciones y hashtags que los posicione primeros en las búsquedas. Así que el trabajo de crear metadatos a partir de descripciones automáticas no parece ser tan relevante.