El sistema de subtitulado automático de YouTube ahora puede describir sonidos ambientales

Publicado el

YouTube

YouTube ha venido ofreciendo hasta la fecha la función de subtitulado automático llevado a cabo por sistemas de máquinas de aprendizaje las cuales realizan las transcripciones de los diálogos que existen en los propios ví­deos.

Desde ahora, y gracias al entrenamiento previo de las máquinas de aprendizaje, YouTube es ahora capaz de subtitular algunos de los sonidos ambientales. Por ahora, los sonidos ambientales que es capaz de subtitular son [RISA], [APLAUSO] y [MÚSICA].

El motivo por el que inicialmente se ofrecerán estas subtitulaciones se debe, según señalan, a que son las más utilizadas en las subtitulaciones realizadas manualmente por las personas.

AnalisisSonido

Reconocen que si bien que el espacio sonoro es mucho más rico y es capaz de ofrecer más información contextualmente relevante que las tres clases señaladas, la información semántica transmitida por estos efectos sonoros en la pista de subtí­tulos es relativamente inequí­voca, en contraposición a sonidos como [RING] que plantea la cuestión de saber qué ha sido, si una campana, una alarma o un teléfono.

En la publicación señala los retos a los que han debido enfrentarse y aquellos retos a los que deberán enfrentarse para que en el futuro sus sistemas sean capaces de detectar otros sonidos que se producen en el ambiente para que luego puedan ser llevados a las subtitulaciones que se realizan automáticamente en los ví­deos.

De esta manera, en aras de la accesibilidad, aquellas personas que hagan uso de las subtitulaciones automáticas ahora podrán tener algo de contexto de lo que se producen en los escenarios donde transcurren los ví­deos. Será cuestión de tiempo que podamos conocer más avances al respecto, sirviendo de mejoras significativas.

Comparte en: