Rescate Lingüístico a través de la Inteligencia Artificial: Más de 4000 idiomas en su radar

Publicado el

reconocimiento lenguas

La inteligencia artificial (IA) ha vuelto a sorprendernos. Su nuevo objetivo: luchar contra la desaparición de idiomas a través de un modelo revolucionario que promete cambiar el panorama actual de la tecnología de reconocimiento y generación de voz.

El mundo de la tecnología suele concentrarse en los idiomas más populares, pero ¿qué pasa con el resto de idiomas que conforman el rico tapiz cultural de nuestro mundo? La respuesta puede residir en un sorprendente avance en el campo de la IA: Los modelos de Voz Multilingüe Masiva (MMS).

Reconocimiento de Idiomas a Gran Escala

La principal hazaña de estos modelos de IA es su capacidad para identificar más de 4000 idiomas hablados, 40 veces más que cualquier tecnología conocida. Imagínate poder interactuar con tu dispositivo en tu idioma nativo, aunque este no sea uno de los más comunes, contribuyendo a mantener viva tu lengua y tu cultura.

Además, los modelos MMS expanden la tecnología de texto a voz y de voz a texto de unos 100 idiomas a más de 1100, diez veces más que antes. Este avance es un verdadero hito en la preservación de la diversidad lingüística.

Usos Diversificados de la Tecnología de Voz

Los posibles usos de esta tecnología son vastos, desde aplicaciones de realidad virtual y aumentada hasta servicios de mensajería, y todo ello en el idioma preferido del usuario. Esto significa que, no importa el idioma que hables, tu voz podrá ser entendida.

Un Enfoque Innovador

El primer reto fue la recolección de datos de audio para miles de idiomas. Para ello, se recurrió a textos religiosos, como la Biblia, traducidos a muchos idiomas diferentes. Las grabaciones de audio públicamente disponibles de personas leyendo estos textos en diferentes idiomas, proporcionaron un promedio de 32 horas de datos por idioma.

El Futuro de los Modelos MMS

El objetivo futuro es ampliar la cobertura de MMS para soportar aún más idiomas y abordar el desafío de manejar los dialectos, a menudo difíciles para la tecnología de voz existente. La apertura de los modelos y códigos al público permitirá a investigadores y desarrolladores de todo el mundo mejorar estos modelos, promoviendo la diversidad lingüística.

Este proyecto es un recordatorio fascinante de cómo la tecnología y la inteligencia artificial pueden ser aliados en la conservación de nuestra diversidad cultural y lingüística. No solo hace más accesible la tecnología a las personas que hablan idiomas minoritarios, sino que también valora y refuerza la importancia cultural de estos idiomas, incentivando su uso y previniendo su desaparición.

Fuente: about.fb.com