Otter, un sistema que graba conversaciones entre personas y reconoce las palabras

otter

Otter se presenta como una nueva aplicación que es capaz de buscar entre nuestras conversaciones de voz, así como en nuestros emails y mensajes de teto. Quieren crear un asistente de voz enfocado en transcribir conversaciones cotidianas, como reuniones y entrevistas, y para ello ya tienen disponibles tanto la web como las apps android y iOS.

Creado por Sam Liang, ex arquitecto de Google que trabajó en Google Maps, y luego vendió su siguiente compañía, la plataforma de ubicación Alohar Mobile, a Alibaba, ha creado el proyecto junto a un equipo que proviene de Google, Facebook, Nuance, Yahoo, Stanford, Duke, MIT y Cambridge, segùn indican en TC.

Es una grabadora de voz que ofrece transcripción automática, pero es capaz de comprender y capturar conversaciones de larga duración que tienen lugar entre varias personas. Indican que la API de voz de Google ha sido entrenada para optimizar la búsqueda por voz, pero no para gestionar un diálogo entre dos individuos. Ellos quieren capturar reuniones, entrevistas, conferencias y demás, y convertirlas en un archivo de búsqueda donde todo lo que se dice se transcribe inmediatamente con el software de AISense.

Para usar la aplicación solo hay que presionar el botón “grabar”, de forma que el archivo de audio se graba y luego está disponible para la reproducción con el audio sincronizado con el texto transcrito. Ellos son capaces de identificar cuándo alguien más comienza a hablar, y pueden separar a cada hablante individual.

En las pruebas realizadas, en inglés, pudieron ver que la tecnología de IA fue capaz de diferenciar entre oradores según lo prometido, pero no capta cada palabra de una conversación, por lo que aún falta algo de camino por recorrer.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.