Así es DINO, la nueva IA de Facebook que detecta mejor los elementos en imágenes y vídeos

Publicado el

Dino

Facebook acaba de compartir en el día de hoy que cuenta con un nuevo algoritmo de Inteligencia Artificial, llamado DINO, desarrollado en colaboración con Inria, que permite el entrenamiento de transformadores, un tipo de modelo de aprendizaje automático, capacitándoles para el descubrimiento y segmentación de los elementos existentes en una imagen o vídeo sin necesidad de definir la detección de objetos específicos.

Un claro ejemplo de segmentación de objetos lo encontramos en todas aquellas herramientas y aplicaciones que nos permiten eliminar el fondo de una imagen, o incluso la sustitución por otro fondo.

Avanzando en la visión por ordenador mediante IA

A nivel general, la segmentación se ha llevado a cabo a través de modelos de aprendizaje supervisado, en el que se ha entrenado a los modelos mediante el uso de grandes volúmenes de elementos etiquetados, caso contrario a lo que ocurre con DINO, que hace uso del llamado aprendizaje no supervisado, que le posibilita entrenar modelos, consiguiendo poder identificar y clasificar los elementos por sí mismos sin necesitar datos o etiquetas de entrada.

De esta manera, mediante el uso de los transformadores, los modelos serán más efectivos a la hora de detectar y clasificar los elementos que pueda haber en una imagen, siendo de especial interés para cubrir los problemas existentes en los modelos de visión por ordenador basado en la Inteligencia Artificial.

En este sentido, los transformadores utilizan las capas de auto-atención, que genera representaciones para cada ubicación atendiendo a lo que existe en otras ubicaciones, permitiendo en su conjunto una mayor comprensión de los elementos disponibles en una imagen de foto o vídeo.

En el caso de DINO, este algoritmo también es capaz de vincular claramente las categorías con los diferentes elementos visuales aunque los mismos puedan estar bastante relacionados.

Su nivel de eficacia, según Facebook, llega hasta el punto de poder detectar copias de las imágenes, aunque este no sea su principal propósito, aunque deja las puertas abiertas a la detección de infracciones por derechos de autor.

Según explica la compañía en un comunicado de blog:

Al utilizar el aprendizaje auto-supervisado con transformadores, DINO abre la puerta a la construcción de máquinas que comprenden imágenes y videos de manera mucho más profunda

Además de DINO, Facebook también ha compartido informaciones sobre PAWS, su nuevo enfoque en en aprendizaje automático, en el que señala que permite obtener clasificaciones de objetos más precisas que los que se obtienen con los enfoques anteriores semi-supervisados ​​y de última generación, llegando a requerir hasta 12 veces menos de capacitación, cuyo potencial uso puede ser la medicina, donde no existen muchas imágenes etiquetadas.

Según Facebook:

La capacidad de trabajar con datos limitados es un beneficio clave del aprendizaje semi-supervisado porque los científicos de datos dedican la mayor parte de su tiempo a limpiar y organizar datos.

Más información. Facebook AI

Comparte en: