parsehub, una excelente forma de extraer datos de cualquier página web

A menudo es necesario obtener datos de listas, de resultados de búsqueda, de páginas con información estructurada… en WWWhatsnew hemos comentado en los últimos 8 años varias soluciones que conseguían realizar esos trabajos, algunos tan sofisticados como import.io o feed43, siendo esta última una de mis opciones preferidas, ya que solo hay que encontrar un patrón en el código y obtener una dirección rss para seguir la evolución del contenido dentro de nuestro lector de feeds.

Ahora os presentamos parsehub (parsehub.com), una solución que podemos usar de forma más intuitiva, tanto para obtener resultados de una lista como para exportar datos de una búsqueda en airbnb, por ejemplo.

Solo tenemos que instalar la extensión en el navegador y acceder a la página de la cual queremos obtener datos de forma automática. Seleccionamos los resultados que queremos en nuestro conjunto y la acción que deseamos realizar, indicando posteriormente el formato de exportación.

Me sorprende el hecho de poder usarse con resultados en mapas, siendo así muy útil para tener listas de lugares encontrados en varias plataformas. En este vídeo podéis ver algunos ejemplos de uso:

La versión gratuita está limitada en el número de páginas y en la velocidad de actualización de las mismas, teniendo precios proporcionales a las necesidades de cada usuario.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.