Detectar cambios en el contenido palabra por palabra: una API para procesamiento de lenguaje natural basado en web

_MG_0239Luis Leiva ha presentado una API orientada a la extracción de textos de un sitio web, de la que cabe destacar tres características interesantes:

– Trabaja a nivel de frase y para sitios web completos, a partir de una URL de partida, gracias a un sofisticado crawler.
Funciona en páginas de contenido dinámico, pues el crawler ejecuta el código JavaScript de las mismas.
Utiliza webhooks para enviar notificaciones push. Las notificaciones se envían cuando se ha producido algún cambio en alguno de los textos de las páginas del sitio web.

En su charla en APIdays Mediterranea se ha comentado un caso real de uso de esta API. En concreto, la startup Sciling la ha usado para desarrollar una aplicación web que estima lo que costaría traducir un sitio web.

Aunque esta API aún no está abierta al público, se espera que lo esté en un futuro.

Fotografía de Mariano Cuesta.

Leticia Martín-Fuertes

Licenciada en Filología Clásica, le apasiona todo lo que tenga que ver con la lengua y la tecnología. Ha trabajado como editora de diccionarios especializados multilingües y libros de economía. Actualmente trabaja como lingüista en la empresa de procesamiento del lenguaje natural Molino de ideas, adecentando textos lo más automáticamente posible que puede, y también es traductora, correctora y redactora especializada en tecnología y contenidos audiovisuales.