DeepL, la reconocida startup alemana de traducción, acaba de lanzar DeepL Voice, su nueva herramienta que permite traducir voz y vídeo en tiempo real. Este avance marca un hito en su evolución, pues hasta ahora la empresa había centrado sus esfuerzos en traducción de texto. Con esta nueva modalidad de traducción en vivo, DeepL busca revolucionar las interacciones multilingües en videoconferencias y reuniones presenciales.
¿Qué es DeepL Voice y cómo funciona?
DeepL Voice permite a los usuarios escuchar una conversación en un idioma y ver la traducción al instante en texto, ya sea en la pantalla de un teléfono colocado estratégicamente en la mesa de una reunión o como subtítulos durante una videollamada. La lista inicial de idiomas para el reconocimiento de voz incluye inglés, alemán, japonés, coreano, sueco, neerlandés, francés, turco, polaco, portugués, ruso, español e italiano, con la opción de mostrar subtítulos en todos los idiomas que DeepL actualmente soporta.
A diferencia de otros servicios de traducción en tiempo real, DeepL Voice no genera una salida de audio o vídeo traducido, sino que muestra la traducción en texto. Este enfoque permite una respuesta casi instantánea, ideal para situaciones en las que se requiere agilidad, como reuniones de negocios o atención al cliente.
Posibles aplicaciones de DeepL Voice
DeepL Voice parece especialmente útil para videoconferencias, en las que la herramienta se integra por ahora exclusivamente con Microsoft Teams, aunque en el futuro podría expandirse a otras plataformas. Sin embargo, su potencial va más allá de las reuniones en línea. Imaginemos un restaurante en el que el personal de servicio puede atender a clientes de diferentes nacionalidades utilizando DeepL Voice para comprender y responder en el idioma del cliente. También en el sector de servicios, esta tecnología podría ayudar a facilitar la comunicación en aeropuertos, hospitales o puntos turísticos, donde la barrera del idioma suele ser un obstáculo.
Desafíos de privacidad y datos
El crecimiento de tecnologías de reconocimiento de voz ha suscitado preocupación sobre la privacidad de los datos. En DeepL, las voces son procesadas en sus servidores para realizar la traducción, pero, según el CEO de la compañía, Jarek Kutylowski, los datos no se almacenan ni se utilizan para entrenar modelos de inteligencia artificial. Además, Kutylowski asegura que DeepL trabaja de cerca con sus clientes para cumplir con regulaciones de privacidad como el GDPR en Europa, garantizando que la herramienta respete la confidencialidad de la información de sus usuarios.
La diferencia de DeepL: enfoque en velocidad y precisión
Uno de los aspectos distintivos de DeepL Voice es su capacidad para realizar traducciones en tiempo real, lo que lo diferencia de otros servicios que funcionan con cierto retraso y no son ideales para situaciones en vivo. Esta ventaja técnica se debe al desarrollo propio de modelos de inteligencia artificial, lo que permite a DeepL mantener un control absoluto sobre el rendimiento de su sistema. En julio, DeepL lanzó un nuevo modelo de lenguaje optimizado específicamente para traducción, que, según la empresa, supera a modelos como GPT-4 de OpenAI en precisión y velocidad en contextos de traducción.
Kutylowski anticipa que esta tecnología de traducción en voz será cada vez más relevante en los próximos años, ya que más empresas y usuarios individuales buscan soluciones que ofrezcan rapidez y fiabilidad en la comunicación multilingüe.
Competencia en el mercado de traducción de voz
El interés por la traducción de voz en tiempo real no es exclusivo de DeepL. Empresas como Google, con su integración de subtítulos en Google Meet, y startups especializadas en IA, como Eleven Labs y Panjaya, también están explorando este sector con propuestas propias. Curiosamente, algunas de estas startups incluso utilizan la tecnología de DeepL en sus sistemas, lo que subraya el avance de la empresa alemana en este mercado.
Desde WWWhatsnew.com creemos que DeepL Voice representa una solución innovadora y necesaria en un mundo cada vez más globalizado, donde la capacidad de entender y ser entendido en tiempo real puede ser un diferenciador clave en sectores como la atención al cliente y la educación. A medida que esta tecnología avance y DeepL logre expandir sus integraciones, no cabe duda de que el impacto en la comunicación global será profundo.