Meta lanza un programa para mejorar la traducción en lenguas poco representadas

Publicado el

"Ilustración minimalista y divertida de un turista confundido intentando ordenar café en un café de Tokio usando una app de traducción. La escena muestra al turista rodeado de clientes divertidos por la situación, en un entorno moderno y con elementos futuristas como hologramas del menú."

Meta continúa su compromiso con la inclusión digital al anunciar el Language Technology Partner Program, una iniciativa que busca mejorar la traducción automática y la tecnología lingüística con especial enfoque en idiomas poco representados. En colaboración con la UNESCO, este programa fomenta la diversidad lingüística en el mundo digital y amplía el alcance de la inteligencia artificial aplicada a la traducción.

El propósito del Language Technology Partner Program

El equipo de Fundamental AI Research (FAIR) de Meta está desarrollando modelos de inteligencia artificial avanzados capaces de realizar tareas cognitivas complejas, como la traducción de idiomas. Su objetivo es crear un sistema de inteligencia artificial multilingüe que pueda adaptarse a nuevas situaciones y mejorar la comunicación global.

El programa invita a organizaciones y colaboradores a contribuir con:

  • Más de 10 horas de grabaciones de voz con transcripciones.
  • Más de 200 frases escritas en diferentes idiomas.
  • Conjuntos de oraciones traducidas en varios idiomas.

Meta utilizará estos datos para mejorar modelos de reconocimiento de voz y traducción automática, que posteriormente serán liberados como código abierto para la comunidad.

Un esfuerzo global con apoyo de la UNESCO

Este programa forma parte del Decenio Internacional de las Lenguas Indígenas de la UNESCO, un esfuerzo para preservar y promover idiomas en riesgo de extinción. Entre los primeros colaboradores está el Gobierno de Nunavut, Canadá, que aportará datos en Inuktitut e Inuinnaqtun.

Además de contribuir al desarrollo de estos modelos, los participantes recibirán talleres técnicos exclusivos dirigidos por investigadores de Meta, donde aprenderán a utilizar herramientas de código abierto para construir sus propias tecnologías lingüísticas.

Meta y su compromiso con la diversidad lingüística

Meta ha mostrado un historial sólido en la mejora de la traducción automática y el soporte para lenguas minoritarias:

  • En 2022, presentó el proyecto No Language Left Behind (NLLB), que sentó las bases para modelos de traducción neuronal.
  • En 2023, colaboró con UNESCO y Hugging Face para desarrollar un traductor basado en NLLB.
  • En 2024, expandió su proyecto Massively Multilingual Speech (MMS), que permite transcribir audio en más de 1,100 idiomas, incluso aquellos sin entrenamiento previo.

Nuevo estándar de evaluación para modelos de traducción

Además del programa de colaboración, Meta está lanzando un benchmark de código abierto para la traducción automática, que servirá como estándar para evaluar el rendimiento de los modelos de inteligencia artificial en este campo. El benchmark está disponible en siete idiomas y los colaboradores pueden contribuir con sus propias traducciones para expandirlo.

Con estas iniciativas, Meta busca desarrollar sistemas de inteligencia artificial más inclusivos y adaptables, capaces de responder a las necesidades comunicativas de personas de diferentes orígenes lingüísticos. A medida que avanza en esta misión, la empresa invita a más organizaciones a unirse a este esfuerzo global y contribuir al crecimiento de la traducción automática.