La capacidad de reconocer personas, objetos o lugares a través de la vista es una tarea que tenemos sumamente naturalizada como personas, dado lo cotidiana que es.
Sin embargo, a pesar de lo sencillo que para nosotros puede parecer, esta tarea depende de una base previa de conocimientos y de millones de conexiones neuronales para ejecutarse correctamente. Una IA desarrollada en Facebook busca recrear esta experiencia.
SEER, contracción de las palabras SElf-supERvised, es un sistema de IA nuevo, que espera ser mucho más eficiente para funciones que van desde el reconocimiento facial hasta otras funciones útiles para coches autónomos.
Esta IA fue entrenada con más de mil millones de imágenes públicas extraídas desde Instagram. Según lo comentado por Facebook, SEER ha logrado superar a los modelos de inteligencia artificial existentes en una prueba de reconocimiento de objetos con una puntuación del 84,2%.
Actualmente, Instagram es utilizado como un álbum de fotografías público por muchas personas. Por lo mismo, con aquella base de datos Facebook tiene acceso a un inmenso y variado catálogo de opciones, contemplando personas de un amplio rango de edades y rasgos corporales, animales, paisajes, alimentos y un largo etcétera. Una muestra importante de esta información fue puesta a disposición de la IA para su entrenamiento.
Aprendizaje auto supervisado para clasificar imágenes
Una inteligencia artificial que opera de forma autónoma, adquiere tras su entrenamiento la capacidad de establecer relaciones entre objetos o variables. En este caso, al tratarse de imágenes, la tarea de SEER es lograr etiquetarlas adecuadamente sin poseer ningún dato de contexto.
Esto marca una diferencia importante en relación a otros sistemas de reconocimiento de imágenes que, a pesar de también funcionar gracias a una IA como motor, estos siguen una dinámica supervisada, dependiendo de etiquetas o clasificaciones previas para replicarlas.
Esta IA se vale de dos elementos claves: uno, es un algoritmo capaz de aprender datos a partir de una gran cantidad de imágenes aleatorias, sin metadatos o anotaciones; mientras que el otro, es una red convolucional lo suficientemente grande como para capturar y aprender todos los conceptos visuales a partir de estos grandes volúmenes de datos complejos.
Al provenir este proyecto desde Facebook, es de esperarse ver su implementación dentro de la misma red social. Su aporte podría potenciar la generación automática de descripciones de imágenes y textos alternativos para personas con discapacidad visual, para filtrar contenido inapropiado e incluso, para categorizar automáticamente de mejor forma los artículos listados en Marketplace.
De momento, SEER se encuentra en fase de investigación, no es más que un prototipo. Para potenciarlo, Facebook comunicó que liberará parte del código de este software bajo una licencia de código abierto, generando una instancia de experimentación para desarrolladores e investigadores, robusteciendo de paso el funcionamiento de esta nueva tecnología de reconocimiento de imágenes.
Al comenzar la presentación de SEER, Facebook enfatizó en que “el futuro de la IA está en la creación de sistemas que puedan aprender directamente de cualquier información que se les proporcione, ya sea texto, imágenes u otro tipo de datos, sin depender de conjuntos de datos cuidadosamente seleccionados y etiquetados para enseñarles cómo reconocer objetos en un foto, interpretar un bloque de texto o realizar cualquiera de las innumerables otras tareas que le pedimos”.
El comunicado oficial lo publicó Facebook a través de su blog de proyectos de inteligencia artificial, donde se comparten más aspectos técnicos sobre el sistema de IA presentado.