audiosearch, un buscador de contenido en podcasts

El problema de los podcasts es que no hay una versión de texto de los mismos, por lo que es difícil encontrar contenido usando un buscador tradicional.

Eso es lo que quieren solucionar con audiosear.ch, un nuevo proyecto que indexa podcasts e identifica el sonido para detectar palabras, permitiendo así que busquemos por textos (asuntos de cualquier tipo) y obtengamos podcasts que los hayan mencionado. Es posible también buscar podcasts por temas y etiquetas, sin depender del contenido de lo que se habla dentro.

Los resultados incluyen el texto del podcast, un trabajo realizado de forma automática (puede tener errores) y un diagrama indicando los momentos durante el podcast en los que se menciona lo que buscamos.

captura-21

De momento solo hay podcasts en inglés, y es difícil que amplíen en poco tiempo a otros idiomas, ya que la tecnología que extrae texto a partir de audio cambia mucho de un idioma a otro, pero podemos probarlo por curiosidad para saber cómo se está avanzando en un tema tan complejo como este.

Si recordamos el servicio de transcripción que realiza de forma automática Youtube podremos ver que aún falta mucho que hacer en este sector, pero no hay duda de que los pequeños innovadores de hoy serán los grandes en un futuro próximo.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.

2 comentarios

  1. Pues es muy interesante y permite difundir ese contenido.
    Aunque con mi poca capacidad de dicción, podcast como el mio seria meritorio que los trascribiesen

  2. Gracias, hace tiempo estaba buscando algo parecido para encontrar podcast de un tema determinado. Ahora lo puedo hacer más ordenadamente.