Cómo recibir por email la actualización de cualquier página web

  • votar

Por Juan Diego Polo el 21/01/2010 - (13)

Aunque para la mayoría de vosotros el uso de lectores de rss sea algo tan común como respirar, para la gran mayoría del mundo es un gran desconocido, usando aún el viejo sistema de newsletters o del F5, lo que es aún peor…

Lo que quiero hacer en este artículo es mostrar una técnica que llevo bastante tiempo utilizando para obtener actualizaciones de ciertas páginas web sin necesidad de ir a buscarla, usando varias herramientas que ya he comentado en wwwhatsnew.com de forma independiente.

Lo primero que vamos a hacer es plantear un problema, mostrando una posible solución en seguida.

Problema

Un grupo de abogados en Brasil tiene que acceder cada día a una página del Tribunal del estado de Paraiba para ver si hay actualizaciones en un proceso judicial. Después de entrar en la página se realiza una búsqueda por número de proceso, cliente o palabra y se obtiene una lista de los archivos pdf que contienen los datos buscados.

La página es www.tjpb.jus.br. Al realizar la búsqueda obtenemos la url personalizada con el término deseado:

[...] servicos/diario_justica?p_busca=2008 [...]

Ya tenemos la url que queremos espiar automáticamente, ahora tenemos que buscar una forma de obtener las actualizaciones y enviarlas por correo electrónico (imaginemos que los abogados no saben nada sobre RSS).

Solución

Usando el servicio ofrecido por Feed43, vamos a configurarlo para generar una dirección RSS con las actualizaciones de la página en cuestión. Después usaremos otro servicio para enviar el rss por email.

Lo primero que tenemos que hacer es encontrar una repetición en el código fuente de la página buscada para que Feed43 pueda detectar nuevos registros. Si buscamos en el html generado por la búsqueda, vemos que los registros (pdfs) se guardan en una tabla con la siguiente estructura:

Una vez tenemos estos datos es relativamente simple configurar Feed43.

Paso 1: indicar la url de la cual queremos extraer los datos.
Paso 2: Indicar el origen y final del código fuente que debe ser revisado y determinar los elementos que se repiten:

El símbolo {%} lo usamos para indicar que es código que queremos recuperar y el símbolo {*} para indicar que es código que queremos ignorar.

Una vez hecho esto, tenemos que crear el feed RSS con los datos extraídos. Cada vez que usemos el símbolo {%} hará referencia a un dato, de forma que podemos construir un feed de la siguiente forma:

Con eso tendremos un feed que, en este caso, muestra el título (fecha) del proceso y el enlace para el pdf resultado de la búsqueda.

Ya tenemos el feed, ahora sólo tenemos que encontrar una forma para que sea enviada por email cada actualización del mismo. Para eso podemos usar servicios como el facilísimo feedmyinbox.com, que nos pide la dirección rss y el email.

Espero que os haya sido útil. Aunque Feed43 es algo difícil al principio, se coge el truco rápido.

Enviar a delicious Guardar en Delicious | Enviar a meneame Enviar a Menéame | Enviar a Google Buzz Enviar a Google Buzz

13 Tweets

Comentarios (13)

  1. Técnica para obtener por email actualizaciones de cualquier web Enero 21, 2010

    [...] Técnica para obtener por email actualizaciones de cualquier web wwwhatsnew.com/2010/01/21/como-recibir-por-email-la-actualiz…  por linklink hace 2 segundos [...]

  2. Ahí fuera: consejos de productividad y orden, blogging, estadísticas, entrevistas y más Enero 25, 2010

    [...] Cómo recibir por email la actualización de cualquier página web: “Lo que quiero hacer en este artículo es mostrar una técnica que llevo bastante tiempo utilizando para obtener actualizaciones de ciertas páginas web sin necesidad de ir a buscarla, usando varias herramientas que ya he comentado en wwwhatsnew.com de forma independiente”. [Wwwhat’s new] [...]

  3. Femtoo – Te avisa cuándo una página web cambia Enero 29, 2010

    [...] el procedimiento que realizo para enviar por email a algunos clientes, de forma automática, la actualización de ciertas páginas web. Para ello siempre he usado una combinación de servicio, obteniendo una dirección feed (cuando no [...]

  4. ilDorade Febrero 2, 2010

    ¿Qué tal una explicación para quienes no sabemos demasiado de HTML?

    Juan Diego Polo Respuesta:

    Es que la aplicación que he comentado sirve para quien diseña emails en HTML. Si no sabes HTML entonces no creo que la vayas a utilizar…

  5. ramirolopera Enero 21, 2010

    Cómo recibir por email la actualización de cualquier página web http://goo.gl/fb/2DnG (vía @wwwhatsnew)

    This comment was originally posted on Twitter

  6. juandiegopolo Enero 21, 2010

    Cómo recibir por email la actualización de cualquier página web http://bit.ly/92ljIl

    This comment was originally posted on Twitter

  7. ricardo51185 Enero 21, 2010

    Cómo recibir por email la actualización de cualquier página web http://bit.ly/67sc5J

    This comment was originally posted on Twitter

  8. Yoriento Enero 21, 2010

    #meintereso Cómo recibir por email la actualización de cualquier página web http://bit.ly/92ljIl

    This comment was originally posted on Twitter

  9. silviapaez Enero 21, 2010

    Síganle. Un capo el Diego RT @juandiegopolo Cómo recibir por email la actualización de cualquier página web http://bit.ly/92ljIl

    This comment was originally posted on Twitter

  10. Eduard0_Aguirre Enero 21, 2010

    Cómo recibir por email la actualización de cualquier página web http://bit.ly/6suRVW

    This comment was originally posted on Twitter

  11. cbex123 Enero 22, 2010

    Cómo recibir por email la actualización de cualquier página web: http://bit.ly/4T0RHT

    This comment was originally posted on Twitter

  12. lyssimix Enero 22, 2010

    Watching: “Cómo recibir por email la actualización de cualquier página web” ( http://bit.ly/4S9ACx )

    This comment was originally posted on Twitter

Comentarios de Twitter añadidos por BackType