Google presenta AutoFlip, solución de código abierto para el recorte inteligente de vídeos

Publicado el

Los móviles inteligentes se han convertido en una parte esencial en nuestras vidas, y entre otros usos, podemos usarlos para ver contenidos audiovisuales. Habitualmente, estos contenidos han sido creados para verlos en pantallas en formato horizontal, como la televisión o el cine, pero que dado que nos hemos habituado a ver contenidos multimedia en vertical con nuestros móviles, además de existir otros posibles formatos para la visualización de vídeos, hay quienes han adaptado este tipo de contenidos para su visualización en otros formatos diferentes, llevando a cabo los correspondientes recortes.

A este respecto, hasta ahora se han llevado varios tipos de procesos de adaptación, o bien se hacía un recorte fijo (estático) a lo largo de todo el contenido, dejando partes interesantes fuera de las escenas de los propios vídeos, o bien se tenía que hacer un recorte manual buscando en cada punto el recorte correcto para que los elementos principales no queden fuera.

Ahora viene Google y ofrece una alternativa más eficiente gracias a la Inteligencia Artificial y el machine learning.

Se trata de AutoFlip, su nueva solución de código abierto que posibilita crear un recorte automático de forma inteligente a lo largo de los contenidos mediante un análisis previo de los mismos para tratar de identificar a los protagonistas en cada momento.

La idea es que los elementos relevantes nunca queden fuera de los recortes, ya sean personas, objetos, o cualquier otro que tome protagonismo. De hecho, al ser de código abierto, Google deja las puertas abiertas a que desarrolladores terceros puedan ampliar las capacidades de AutoFlip para mantener dentro de la imagen cualquier elemento que sea relevante, más allá de las personas o objetos actualmente soportados.

Acorde a Google:

Utilizamos modelos de detección de objetos basados en el aprendizaje profundo para encontrar contenido interesante y destacado en el cuadro. Este contenido generalmente incluye personas y animales, pero se pueden identificar otros elementos, dependiendo de la aplicación, incluyendo superposiciones de texto y logotipos para comerciales, o detección de movimiento y pelota para deportes.

Después de identificar a los protagonista en cada cuadro:

AutoFlip elige automáticamente una estrategia de reencuadre óptima: estacionaria, panorámica o seguimiento, dependiendo de la forma en que se comportan los objetos durante la escena (por ejemplo, moverse o estacionaria).

Con AutoFlip se conseguirá una mejor adaptación de los contenidos audiovisuales creados en un formato concreto para su disfrute en formatos diferentes, para su visualización en móviles o en otros tipos de soportes electrónicos.

Para más información, los interesados pueden acudir al blog oficial de código abierto de Google.

Crédito de la imagen: Google