Google prueba un sistema de reconocimiento de voz offline, 7 veces más veloz

google reconocimiento de voz

Google anda probando un nuevo sistema de reconocimiento de voz en dispositivos móviles, útil tanto para smartphones como para wearables y otros equipos, con mejoras tan grandes que hasta funciona sin Internet, es más acertado, resulta en promedio 7 veces más veloz y ocupa menos recursos técnicos que el software actual.

Por supuesto, aunque el “Ok, Google” tienen un nivel de reconocimiento enorme, no son pocas las veces que se ve limitado por el continuo requerimiento de una estable conexión a Internet o la combinación hardware/software del dispositivo. Claro, vale entender que los servidores de Google son los que posibilitan el reconocimiento en tiempo real y ese intercambio de información entre el equipo local y el remoto puede producir un cierto retraso.

Así que lo que ahora se anda probando es un sistema tan ligero que apenas ocupa 20.3 Mb en la totalidad de sus componentes (incluyendo el modelo acústico base) y tan potente que en las primeras 2.000 horas de dictados -alrededor de 3 millones de grabaciones tomadas de la búsqueda de Google por voz-, dio con una tasa de error en el reconocimiento de palabras de apenas 13.5%. Por cierto, para hacer más justas las pruebas, las capturas se “contaminaron” con audio aleatorio tomado de videos de YouTube emulando así un ambiente ruidoso usual.

Un Nexus 5 ha sido la unidad experimental y tras el sistema se combinan técnicas de aprendizaje de máquinas además de un método para unificar el reconocimiento de comandos de voz y dictados simples en un modelo acústico altamente comprimido. Claro está, para ahondar en los detalles del trabajo, lo mejor es recurrir al artículo científico que argumenta lo producido.

Más información: Artículo completo en arXiv.org (PDF) | Vía: ZDNet

Juan David Quiñónez

Estudiante de Estadística en la Universidad Nacional de Colombia. Amante de las nuevas tecnologías, la ciencia, el mundo académico y las aplicaciones de las anteriores temáticas en la red. Escribe en wwwhatsnew.com desde finales del 2011.