La nueva frontera del doblaje: ElevenLabs y su apuesta por la IA en la traducción de contenido

Publicado el

sonido

La traducción y el doblaje de contenido han sido durante mucho tiempo tareas manuales que requieren un alto nivel de especialización. Sin embargo, la tecnología está cambiando la forma en que abordamos estas tareas, haciendo que sean más accesibles para los creadores de contenido de todos los tamaños.

ElevenLabs es una startup especializada en clonación de voz y síntesis. Fundada por ex empleados de Google y Palantir, la empresa ha estado trabajando en soluciones que facilitan la traducción y el doblaje de contenido audiovisual. Ya os comentamos hace unas semanas las funciones que incluye. Ahora lo amplían con AI Dubbing.

AI Dubbing: La herramienta que rompe barreras idiomáticas

AI Dubbing es una solución tecnológica que busca eliminar las barreras idiomáticas en el mundo del contenido audiovisual. Desarrollada por ElevenLabs, esta herramienta tiene la capacidad de traducir cualquier tipo de discurso, ya sea en un podcast, un video de YouTube o incluso en producciones de cine y televisión, a más de 20 idiomas diferentes. Pero no se trata solo de una simple traducción; la herramienta va más allá al conservar las características de voz originales del hablante, incluidas las emociones y la entonación. Esto significa que el resultado final no solo es comprensible sino también auténtico, manteniendo la esencia del contenido original.

Cómo funciona

El funcionamiento de AI Dubbing es un proceso de múltiples etapas que utiliza tecnologías avanzadas de inteligencia artificial:

  • Eliminación de ruido de fondo: Antes de cualquier traducción, la herramienta se encarga de limpiar el audio, eliminando cualquier ruido de fondo y diferenciando entre música y diálogo.
  • Transcripción y traducción: Una vez que el audio está limpio, se transcribe el diálogo al idioma original. Este texto transcribido se traduce luego al idioma objetivo utilizando modelos de traducción automática.
  • Síntesis de voz: El texto traducido se convierte de nuevo en audio. Aquí es donde la herramienta brilla, ya que utiliza tecnologías de clonación de voz para mantener las características de voz del hablante original.
  • Integración final: El audio traducido se sincroniza con cualquier música o ruido de fondo que se haya eliminado inicialmente, preparando el contenido doblado para su uso final.

Es importante señalar que la herramienta tiene algunas limitaciones en términos de cantidad de caracteres. Según Mati Staniszewski, CEO de ElevenLabs, aproximadamente un minuto de AI Dubbing equivale a alrededor de 3.000 caracteres. Esto es algo que los usuarios deben tener en cuenta al preparar su contenido para la traducción.

La introducción de AI Dubbing podría tener un impacto significativo en la industria del contenido. Tradicionalmente, el doblaje y la traducción han sido procesos manuales que requieren un equipo de expertos y, por lo tanto, son costosos. AI Dubbing ofrece una alternativa más accesible y eficiente, especialmente para creadores de contenido más pequeños que no tienen los recursos para contratar equipos de traducción y doblaje.

Esta herramienta es especialmente útil para creadores de contenido independientes, estudios de cine y televisión que buscan globalizar su contenido sin incurrir en altos costos de traducción manual.

Empresas como OpenAI, MURF.AI, Play.ht y WellSaid Labs también están trabajando en tecnologías de voz basadas en IA, aunque con enfoques y aplicaciones ligeramente diferentes.

Más información en ElevenLabs.io