El equipo de Google dio a conocer los resultados de un nuevo proyecto de investigación que arroja grandes avances en los modelos de traducción.
Google Translatotron es el nombre de la herramienta que están desarrollando y promete ser la primera en implementar un modelo de traducción directa, sin intermediario. Es decir, traducción de voz a voz de un idioma, sin que el texto forme parte del proceso, solamente audio.
En los sistemas de traducción actuales, las representaciones de texto forman parte fundamental en diferentes etapas del proceso. Para evitar este paso, la herramienta de Google procesa la voz como un espectrograma.
Registra la entrada de voz (del idioma original), la procesa y crea un nuevo espectrograma con el nuevo idioma, como se muestra en la imagen. Este modelo tiene varios beneficios, por ejemplo, minimiza los errores en la traducción durante el proceso y puede mantener el tono de la voz de origen.
El equipo de Google ha compartido algunos audios en este enlace con traducciones de español a inglés. Primero se muestra la entrada de voz en español, la referencia en inglés y los audios que comparan el sistema de traducción actual (sistema de cascada) y la herramienta de Google Translatotron.
Por el momento, no han conseguido superar al sistema tradicional, pero Google Translatotron representa un gran avance en el modelo de traducción directa.