Gary Illyes, webmaster de Google, nos explica que, siguiendo con su misión de organizar la información en el buscador para hacerla más accesible para el usuario, saben que en nuestras búsquedas en Google aparecen millones de links que no son archivos HTML, como PDFs o presentaciones.
Google empezó a listar archivos PDF en 2001 y actualmente hay incluídos cientos de millones de archivos de este tipo en nuestras búsquedas. En su artículo Illyes comenta alguna de las dudas más relevantes acerca de este tipo de archivos tan comunes y responde las preguntas más comúnmente realizadas.
Y es que Google puede indexar cualquier tipo de archivo PDF y en cualquier tipo de lenguaje (a no ser que esté encriptado). También los links incluídos en los documentos en PDF funcionan igual que un link que podamos encontrar en una página HTML. Leer páginas en PDF, aunque al principio no fuese de lo más popular, sí va siendo cada vez más común: curiosamente nos explica Illyes que una de las búsquedas más realizadas incluye PDFs como primeras opciones.
Si no queremos que este tipo de archivos de nuestra web salgan en nuestras búsquedas, hay disponible una URL removal tool en Google Webmaster Tools que nos dará la opción de eliminar los PDFs y otro tipo de URLs de la lista.
Os dejamos con un vídeo de Matt Cutts sobre el asunto:
Vía: Google Webmaster Central Blog
3 comentarios en “Sobre el PDF en las búsquedas de Google”
Comentarios están cerrados.
El del vídeo es Matt Cutts, Ingeniero del grupo de Search Quality de Google 🙂
Tienes razón, por el artículo parecía que queríamos decir que el vídeo también era de Gary Illyes.. ya lo hemos corregido. Gracias!
Gracias a vosotros por publicar tanta información de calidad!