Para aquellos que se dedican a analizar sitios web o son creadores de contenido sabrán que muchas veces nos encontramos con contenido redundante y que no es tarea sencilla el identificarlo. La utilidad que pasamos a comentar nos servirá de apoyo para facilitar esa tarea.
De los creadores de CopyScape, una popular herramienta web para detectar plagios y contenidos duplicados en Internet, tenemos a Siteliner, un servicio web que nos permitirá rastrear nuestra web en busca de enlaces rotos y contenido duplicado básicamente, además de otras opciones interesantes que pasamos a comentar en detalle.
Tras introducir la dirección de la página web obtendremos un listado de todas nuestras páginas internas mostrando datos como el número de palabras que contiene, el tamaño o el ”˜Page power”™, un dato que representa la relevancia de ese enlace en el ámbito de nuestra página web.
La parte interesante está en el informe de contenido duplicado, haciendo clic en el menú de la parte izquierda. En esa tabla veremos valores como el porcentaje de palabras duplicadas sobre el total de palabras en la página, la cantidad de páginas que coinciden con ese mismo contenido y el ”˜Page power”™ de nuevo.
Si hacemos clic en cada enlace, nos llevará a esa página de nuestra web con el contenido supuestamente repetido resaltado en un color distinto y en la parte derecha veremos la lista de páginas que contienen ese mismo contenido. Podremos descargar estos reportes y tablas generadas en formato PDF, CSV o XML.
En el resumen de resultados vamos a ver diferentes gráficas sobre el contenido repetido y una comparación con otros sitios analizados por Siteliner de la cantidad de enlaces internos o el tamaño medio de las páginas, entre otros.
La herramienta es gratuita para analizar un límite de 250 páginas, que es poco para aquellos blogs con gran cantidad de contenido, pero suficiente para tener una idea inicial de como está nuestro sitio. Si queremos más, tienen un servicio premium con la que podremos analizar sin límite hasta 25.000 páginas de nuestro sitio web, también guardando los reportes y con un poco de configuración como configurar el porcentaje de páginas en las que debería aparecer un contenido para marcarlo como duplicado.