Dos formas de extraer datos estructurados de una web

En algunas ocasiones nos encontramos con páginas que incluyen información que queremos exportar, rastrear y monitorizar de alguna forma. Cuando existe un canal RSS con las actualizaciones de dichos datos, es sencillo tenerlas bajo control con un lector como Feedly, TheOldReader o cualquiera de las muchas alternativas existentes en la web, pero en caso contrario tenemos que inventar alguna forma de seguir las actualizaciones sin necesidad de estar constantemente actualizando la página.

Hoy os presento dos opciones, una sencilla y básica, la otra extremadamente flexible, y más compleja. Empecemos por la segunda:

Feed43

feed

Conozco esta opción desde 2006, opción que poco ha cambiado con el tiempo, aunque continúa siendo tan efectiva como siempre.

Se trata de una herramienta en la que tenemos que mostrar la estructura HTML de cualquier página indicando el patrón que debe seguir para avisarnos de las actualizaciones. Si vemos que el contenido que queremos rastrear tiene un tag HTML especí­fico o mantiene una estructura en el código que generalmente es repetida, Feed43 conseguirá crear un Feed, una dirección RSS, en cualquier página.

Las direcciones creadas pueden ser actualizadas en cualquier momento para adaptarse a una posible actualización de código.

La ventaja es que es capaz de crear un feed de prácticamente cualquier página web, la desventaja es que para hacerlo hay que conocer nociones básicas de HTML.
Continúa leyendo «Dos formas de extraer datos estructurados de una web»

truBackup, realizando copias de seguridad y restablecimiento de datos en dispositivos Android

truBackup

Dentro de las aplicaciones para la realización de copias de seguridad y restauración de datos, truBackup es otra opción a tener en cuenta, ya que además de poder hacer copias de seguridad para diferentes tipos de datos por separado, cifrándose con AES de 256 bits, permite el restablecimiento de los mismos en el momento en el que nos haga falta, en aquellos dispositivos Android que dispongamos. Además, hay que señalar que uno de los soportes que podemos usar para las copias es nuestra propia cuenta de Dropbox, pudiéndola usar para varios dispositivos.

Los contactos, los SMS, los archivos multimedia, y las aplicaciones, son los tipos de datos que podemos seleccionar para la realización de las copias de seguridad, donde además, la primera vez que entremos, se nos preguntará por el soporte que deseamos usar para dichas copias.

Además, podemos programar para la realización de las copias de seguridad, ver el progreso de los mismos, e incluso determinar que lo haga solamente bajo conexiones wifi a través de las preferencias de la aplicación.

truBackup se encuentra disponible gratuitamente de forma promocional en Google Play, contando con una nueva versión que corrige una serie de problemas.

Enlace: truBackup | Ví­a: AddictiveTips

Followers on Vine, analí­ticas y datos de tus seguidores de Vine [iOS]

vine

Recuerdo haberos presentado y haber enlazado unas cuantas herramientas para analizar estadí­sticas y seguidores en Twitter, tanto los que analizan datos de nuestros followers como los que nos detectan seguidores falsos o variantes. Hoy os presentamos una herramienta con objetivo similar que nos servirá para analizar este tipo de datos en Vine.

Es cierto que Vine no tiene los mismos usuarios que Twitter y, además, es bastante más nuevo, pero eso no significa que los usuarios no puedan hacer uso de este tipo de analí­ticas. Por ello Followers on Vine es una aplicación para iOS que nos avisará de quién nos sigue y nos enviará notificaciones también cuando perdamos a nuestros followers, así­ como nos listará aquellos usuarios a los que seguimos pero que no nos siguen y a los nuevos y recientes seguidores en una lista aparte.

Ingresaremos los datos en la app registrándonos con nuestra propia cuenta de Vine, y desde la misma página principal recibiremos un recuento de posts del usuario junto a los nombres de lista de contactos que nos sigue. Para analizar la fluencia de seguidores dispondremos de estas categorí­as: nuevos seguidores, nuevos no seguidores, seguidores a los que no seguimos, usuarios a los que seguimos, y usuarios a los que seguimos pero que no nos siguen a nosotros.

Podéis descargaros Followers on Vine para iOS de este enlace a iTunes.

Los datos de Google Analytics Premium se integrarán en BigQuery próximamente

Big Query

Desde Google I/O 2013 llega un nuevo anuncio de especial interés para aquellas empresas y organizaciones que analizan grandes volúmenes de datos mediante sus cuentas de Google Analytics Premium. Y es a finales de año verán integrado BigQuery para las consultas granulares y complejas de datos no muestreados.

Para quienes no estén familiarizados con Google BigQuery, se trata de un servicio de Google orientado al sector profesional que permite la realización de análisis interactivos de grandes conjuntos de datos, de hasta millones de filas, pudiendo exportarlos.

De esta manera, podrán aprovechar la infraestructura de Google para la computación masiva de grandes volúmenes de datos en segundos, a través de la nube, de forma colaborativa y segura, y pagando sólo por el uso. En el blog de Analytics enumeran algunas posibilidades para desarrolladores y cientí­ficos de datos, como el análisis de comportamiento de los visitantes en grandes rangos de fechas, análisis personalizados detallados, el entendimiento de consultas complejas, y la integración con almacenes de datos, entre otras posibilidades.

Los desarrolladores interesados pueden mostrar su interés registrándose en un formulario habilitado para ello, permitiéndoles recibir más información y conocer cuando la integración está disponible.

Enlace: Formulario de registro | Ví­a: Google Analytics Blog

AudienceSync, nueva herramienta de Disqus para que los editores puedan sincronizar datos de sus usuarios

Para muchos de nosotros, Disqus tiene que ser ya una herramienta familiar, que nos permite establecer conversaciones dentro de sitios web, ya sean estos blogs u otros espacios web, donde incluso algunos medios tradicionales también lo tienen incorporado en sus publicaciones digitales. Dicho de otra manera, Disqus es la herramienta más conocida para integrar un espacio de discusión dentro de los sitios web,

En la actualidad, dispone de más de 100 millones de perfiles de usuario, y continúa creciendo a un ritmo de 1,5 millones de usuarios cada mes. La novedad la encontramos en el lanzamiento de una nueva herramienta llamada AudienceSync, con la que Disqus permitirá a los editores la sincronización de los datos de los perfiles de usuarios con su propia información. De esta manera, permitirá a las publicaciones recabar más información de los usuarios, lo que les permitirá reforzar sus campañas de marketing, teniendo un enfoque de tipo CRM.

Según Disqus, su nueva herramienta es diferente del protocolo Disqus Single Sign-On, aunque se basa en el protocolo OAuth. Las compañí­as que deseen emplear AudienceSync en sus espacios, deberán ponerse en contacto con Disqus para comenzar el proceso, que se ofrece de manera gratuita.

De esta manera, cuando cualquier usuario quiera dejar un nuevo comentario en un sitio web que lo tenga implementado, puede encontrarse con que necesitará enviar información adicional de sí­ mismo, ya sea su edad, su localidad, o cualquier otra información que la publicación desee obtener, con el fin de optimizar sus campañas.

Enlace: AudienceSync

Natalia Martos reflexiona sobre el impacto que generará la nueva normativa europea sobre las cookies publicitarias

En Huffington Post, Natalia Marcos (Directora Jurí­dica Digital, de PRISA) hace una diferenciación entre las cookies que se instalan en nuestro navegador con el fin de ofrecernos una experiencia más personalizada en sitios web respecto de aquellas que se usan con fines publicitarios, las cuales son gestionadas por terceras empresas que no se identifican ni explican los fines que dará con nuestros datos.

Cookies
© momius - Fotolia.com
Es ahí­ donde la Unión Europea quiere poner las cosas claras con el fin de que los usuarios seamos conscientes, y por ende, aceptemos o no el uso de dichas cookies en nuestras sesiones de navegación, todo bajo la premisa de la protección de la privacidad. Como bien aclara Natalia Marcos, esto supondrá un completo cambio en lo que respecta a los modelos de negocio en Europa, y que será aplicable a los 27 estados miembros, donde España ya la ha traspuesto como normativa nacional de aplicación directa a través del Real Decreto-Ley 13/2012, modificando así­, la vigente LSSICE (Ley de Servicios de la Sociedad de la Información y del Comercio Electrónico).

En la práctica, los sitios web nos deben ofrecer las formas que nos permitan aceptar o rechazar el uso de las cookies publicitarias, aunque hay aspectos que no quedan claros, ya que no definen las formas ni el cómo tenemos que ofrecer el consentimiento. Aún así­, la industria online española cuenta con una guí­a sobre el uso de las cookies, validada ya por la propia AEPD.

Al final de la publicación, Natalia reflexiona acerca de la evolución que tendrá la adaptación de la normativa en las webs españolas, y conocer el impacto económico que supondrá en la actividad publicitaria.

Más información: ¿Cómo afectará la nueva legislación sobre ‘cookies’ al mundo digital? y PDF de la agpd

LinkedIn lanza CheckIn para facilitar a los reclutadores obtener y gestionar la información de los candidatos

Ante el panorama laboral que sufren millones de jóvenes de todo el mundo debido a la crisis económica, no es de extrañar que hayan apostado por seguir formándose y estar mejor preparados para tener más posibilidades laborales. De hecho, este segmento de la población sigue aumentando su presencia en LinkedIn, el cual es usado como herramienta de búsqueda de empleo según sus perspectivas laborales.

En este sentido, LinkedIn acaba de lanzar un nuevo producto a nivel mundial como parte de la división Talent Solution. Se trata de CheckIn, una aplicación enfocada a reclutadores de talento que permite la recopilación y gestión de los datos obtenidos de los propios candidatos, con la idea de que los reclutadores se centren en las perspectivas de los candidatos que en recordar la información que éstos les han aportado en los propios encuentros y entrevistas, las cuales guarda la propia aplicación.

La aplicación aún no está disponible para todos los clientes hasta el mes de Julio, está enfocado a las perspectivas del estudiante universitario, y además, se ejecutará en dispositivos móviles, lo que permitirá no sólo la recopilación de los datos, sino además, el enví­o de correos electrónicos a los candidatos más interesantes para los puestos de trabajo, donde podrán ofrecer toda la información de las empresas, sus modos de trabajo, y de las culturas de funcionamiento.

Más información: Presentación en The LinkedIn Talent Blog

Los usuarios de Sync han sincronizado más de 1 PB de datos desde su lanzamiento

Sync

Como ya comentamos en su momento, Sync es una herramienta de BitTorrent que permite la sincronización entre diferentes dispositivos para la transmisión de archivos a través de la tecnologí­a p2p, cifrando el tráfico generado con AES de 256 bits y sin necesidad de depender de servidores de terceros ni de la nube para el almacenamiento de archivos. Fue el pasado 23 de Abril cuando Sync lanzó su alfa pública, lo que ha permitido incrementar el número de usuarios que hace uso de esta herramienta, incrementándose así­ la cantidad de datos compartidos.

Ya conocemos algunas informaciones ofrecidas por la propia BitTorrent. Y es que desde su lanzamiento en Enero de este año hasta el lanzamiento en fase alfa pública, los usuarios de Sync han compartido cerca de 200 TB (Terabytes) de datos, y si a eso se le suma los más de 800 TB de los últimos trece dí­as, en total, han compartido un total de más de 1 PB (Petabyte) de datos, que se dice pronto.

A modo de curiosidad, BitTorrent señala que Internet Archive alberga unos 10 PB de datos, lo que supone actualmente el 10% de los datos compartidos a través de Sync. A saber la cantidad de datos que se sincronizarán hasta el lanzamiento de la versión estable, que incluso podrí­a llegar a los 10 PB, superando a la propia Internet Archive.

Enlace: Anuncio oficial

Digg anuncia el lanzamiento de Reader en Junio en fase beta, junto con otros datos

DiggDigg ha desvelado este Martes los datos de la segunda encuesta realizada recientemente por parte de los usuarios inscritos en conocer su propio reemplazo de Google Reader. Y entre números, Digg ha dejado entrever el camino que tomarán en el desarrollo de su servicio, anunciando el lanzamiento de la beta en el mes de Junio. No hay que olvidar que Google Reader dejará de estar operativo justo el 1 de Julio.

La encuesta ha sido enviada a más de 18.000 personas, de donde más de 8.600 personas respondieron a la misma, en relación a la primera encuesta, que fue enviada a más de 17.000 personas y sólo respondieron 8.000 de ellas. De entre los datos se destaca que casi la mitad de los usuarios no han usado las caracterí­sticas sociales cuando Google Reader disponí­a de ellas, mientras el 17% sí­ las usaban de manera intensiva, e indica que en el lanzamiento, la versión disponible no dispondrá de muchas de ellas.

Además, el 55% de los encuestados comparten noticias a través de Facebook y Twitter, aunque un 75% lo hacen a través del correo electrónico. En este sentido, el reemplado de Digg podrá contar con soporte para compartir contenidos en Facebook, Twitter, Google+, Tumblr, Pinterest, y Path.

También se desvela en las gráficas que más de un tercio de los encuestados no usan los servicios que permite aplazar sus lecturas para más adelante, aunque Digg tiene en mente dar soporte a Pocket, Instapaper, Evernote, y Readability.

Por último, la mayorí­a de los usuarios no estarí­an dispuestos a pagar por el servicio, aunque hay un grupo de ellos que sí­, de manera que Digg estarí­a barajando opciones para ofrecer su servicio, sin que haya nada claro por el momento.

Está claro que el tiempo del fin de Reader se acerca, y hay que depositar la confianza en otro servicio que más se le pueda acercar a Google Reader.

Enlace: Publicación oficial de Digg

Sush.io, panel unificado para la gestión de los datos financieros a través de la nube

Sush.io

Tanto las personas como las empresas tenemos que dedicar parte de nuestro tiempo para gestionar nuestros asuntos económicos, algo que hasta hace bien poco hací­amos sobre papel, organizándolos y haciendo seguimiento de los datos que nos ofrecen. En la actualidad, ya realizamos muchos trámites a través de Internet, además de realizar compras y otras actividades que podemos gestionar electrónicamente.

Aquí­ es donde entra Sush.io, una nueva plataforma, en fase beta cerrada, que se autodenomina como «el panel inteligente de los datos financieros». La idea está en conectar con una serie de servicios online y hacer el seguimiento de nuestros asuntos económicos de manera unificada a través de los informes que aparecen en dicho panel. Sush.io irá recabando datos de forma automática de todas nuestras cuentas conectadas y las irá analizando para presentarnos los informes necesarios.

Sush.io

Además de las personas, las empresas cuentan con la opción pro destinadas a ellas, donde en cualquier caso Sush.io tiene la misión del ahorro de tiempo para dedicarlo a los asuntos más importantes, en caso de las empresas, centrarse en sus negocios.

Sush.io contará con una aplicación para Mac OS X y una versión móvil para iPhone e iPad. En la nota de prensa no se menciona otras plataformas móviles.

Por ahora tan sólo nos queda solicitar una invitación y esperar.

Enlace: Sush.io