El equipo de Facebook anunció mejoras importantes en la IA que utiliza para generar descripciones de imágenes que se publican en la plataforma. Una tecnología pensada para los usuarios con discapacidad visual.
Este sistema, diseñado por Facebook en 2016, se fue mejorando para ofrecer una dinámica más rápida y precisa. Pero su última actualización da un paso más allá, ya que puede ofrecer descripciones más detalladas de las imágenes.
Facebook mejora su IA para ayudar a usuarios con discapacidad visual
Por cada imagen que se publica en Facebook, la IA genera automáticamente un subtítulo que trata de describir la escena. Facebook no quiere que esta IA describa solo elementos sueltos de la imagen, sino que pueda transmitir la escena completa para que los usuarios pueden entender el contexto y disfrutar de la publicación.
Un objetivo que está presente en esta nueva versión de la IA, ya puede reconocer muchos más elementos y ofrecer una descripción más detallada de la escena. No solo puede distinguir si hay personas o animales, sino que también puede reconocer diferentes tipos de actividades, lugares y hasta la posición de los elementos.
Por ejemplo, en la imagen de arriba, la IA pudo reconocer que hay 5 personas tocando instrumentos musicales, con sombreros y tambores. Pero no solo eso, sino que también puede describirlo de una forma que la persona entienda cómo esta configurada la escena y qué elementos son importantes. Tal como ves en la imagen, toda la información está clasificada de tal forma que se pueda brindar todo el contexto de la escena.
Toda esta información ayudará a las personas con discapacidad visual a entender de qué se tratan las imágenes o fotografías que comparten sus amigos. Por supuesto, es posible que no deseen obtener esa información por cada imagen que aparezca en su feed, así que Facebook les permitirá elegir cuándo desean recibir una descripción más detallada de la fotografía.