Crean software capaz de leer los labios de las personas con gran precisión

Publicado el

lipnet

En los últimos tiempos hemos visto como la tecnologí­a está adquiriendo la capacidad de aprendizaje para realizar un sinfí­n de tareas, pudiendo llegar incluso a superar las capacidades de las propias personas. En este sentido, investigadores del Departamento de Ciencias de la Computación de la Universidad de Oxford han desarrollado LipNet, un software especializade en la lectura de labios.

Acorde a dichos investigadores, LipNet alcanza el 93,4% de precisión, superando a personas experimentadas en la lectura de labios, que sólo llegó al 52% de precisión. Para llegar a ese nivel de precisión, los investigadores pusieron el acento en el hecho de que las personas sean mejores en la lectura de labios conforme más largas sean las palabras, según estudios, dándole importancia de las caracterí­sticas del contexto de las mismas en el propio canal de comunicación.

Y ha sido en base a dicha observación, según indican, por lo que se han visto motivados para la creación de LipNet, a la que describen como «un modelo que mapa una secuencia de longitud variable de fotogramas de ví­deo a texto, haciendo uso de convoluciones espacio-temportales, una red recurrente de LSTM y la pérdida de la clasificación temporal conexionista, entrenada enteramente de extremo a extremo».

Para que quede más claro, en lugar que concatenar palabras en base al análisis de las imágenes sin más, LipNet hace uso de las redes neuronales artificiales para su entrenamiento de modo que tendrá en cuenta el contexto de las palabras en la propia frase para luego volver al inicio y descifrar cada palabra.

Sin duda, es un uso más que se hace de la inteligencia artificial para el entrenamiento de sistemas para que realice diferentes tareas. En este caso, podrí­a aplicarse a diferentes usos, entre ellos, facilitar la comprensión en aquellas personas con problemas auditivos, entre otros.

Comparte en: