YouTube ha venido ofreciendo hasta la fecha la función de subtitulado automático llevado a cabo por sistemas de máquinas de aprendizaje las cuales realizan las transcripciones de los diálogos que existen en los propios vídeos.
Desde ahora, y gracias al entrenamiento previo de las máquinas de aprendizaje, YouTube es ahora capaz de subtitular algunos de los sonidos ambientales. Por ahora, los sonidos ambientales que es capaz de subtitular son [RISA], [APLAUSO] y [MÚSICA].
El motivo por el que inicialmente se ofrecerán estas subtitulaciones se debe, según señalan, a que son las más utilizadas en las subtitulaciones realizadas manualmente por las personas.
Reconocen que si bien que el espacio sonoro es mucho más rico y es capaz de ofrecer más información contextualmente relevante que las tres clases señaladas, la información semántica transmitida por estos efectos sonoros en la pista de subtítulos es relativamente inequívoca, en contraposición a sonidos como [RING] que plantea la cuestión de saber qué ha sido, si una campana, una alarma o un teléfono.
En la publicación señala los retos a los que han debido enfrentarse y aquellos retos a los que deberán enfrentarse para que en el futuro sus sistemas sean capaces de detectar otros sonidos que se producen en el ambiente para que luego puedan ser llevados a las subtitulaciones que se realizan automáticamente en los vídeos.
De esta manera, en aras de la accesibilidad, aquellas personas que hagan uso de las subtitulaciones automáticas ahora podrán tener algo de contexto de lo que se producen en los escenarios donde transcurren los vídeos. Será cuestión de tiempo que podamos conocer más avances al respecto, sirviendo de mejoras significativas.