Mozilla ya tiene conjuntos de datos de reconocimiento de voz en castellano, catalán y vasco

Commom Voice

Es posible que ya hayáis oído hablar del proyecto Commom Voice de Mozilla, una iniciativa que pretende incluir conjuntos de datos de reconocimiento de voz de código abierto en varios idiomas, algo de extrema importancia para el desarrollo de sistemas donde la voz es el protagonista.

Ahora hay novedades en este tema: Mozilla ha incluido 18 idiomas diferentes al proyecto, incluyendo holandés, esperanto, farsi, vasco, español, francés, alemán, chino mandarín (tradicional) y galés, entre otros.

Son en total 1.400 horas de clips de voz grabados de 42.000 contribuyentes, voluntarios, principalmente, que quieren ayudar a mejorar la tecnología de reconocimiento de voz en varios idiomas, así como lingüistas y profesionales que trabajan en este sector.

Commom Voice

De esta forma, los desarrolladores que no tienen los recursos de Apple, Google o Amazon, pueden crear productos entrenados con datos creados por gente real, con una colección de voces gratuita, disponible en voice.mozilla.org.

Para colaborar solo hay que acceder a la página principal del proyecto, donde es posible solicitar un nuevo idioma o participar de uno existente. Solo tenemos que pulsar en dónde queremos colaborar y leer en voz alta las frases que allí tenemos disponibles, alto y claro, para que los desarrolladores puedan crear proyectos usando nuestra voz como pilares.

De esta forma se pueden mejorar los sistemas que transforman de voz a texto, texto a voz y DeepSpeech, todo gracias a la colaboración desinteresada de millones de personas.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.