La comunidad de SEO y los entusiastas de la tecnología están en vilo tras la posible filtración de 2.500 páginas de documentación interna de Google. Estos documentos, que detallan el funcionamiento del algoritmo de búsqueda de la empresa, ofrecen una visión sin precedentes sobre el sistema que domina internet. Aquí desglosamos todo lo que necesitas saber sobre este escándalo y sus implicaciones.
La Filtración y su Impacto
Según Rand Fishkin, un veterano en el mundo del SEO, un informante le compartió esta masiva colección de documentos con la esperanza de que se revelara la verdad sobre cómo funciona realmente el algoritmo de búsqueda de Google. Fishkin ha indicado que los documentos proporcionan una visión detallada del API de búsqueda de Google y la información accesible para sus empleados.
Datos Clave del Contenido Filtrado
Los documentos son muy técnicos y podrían ser más comprensibles para desarrolladores y expertos en SEO. Aunque no demuestran directamente que Google use todos los datos mencionados para sus rankings, sí sugieren qué tipo de información recopila y podría valorar. Mike King, otro experto en SEO, ha escrito un análisis donde menciona que la filtración toca temas como:
- Tipos de datos recolectados: Información sobre cómo Google recopila datos de las páginas web, incluyendo datos de Chrome, a pesar de que Google ha negado públicamente su uso para el ranking.
- Prioridades en temas sensibles: Detalles sobre cómo Google eleva ciertos sitios para temas críticos como elecciones.
- Manejo de sitios pequeños: Información sobre cómo el algoritmo de Google trata a las webs de menor tamaño.
Lo que revelan los Documentos
Características del Ranking
Los documentos indican que hasta marzo de 2024, Google utiliza 2.596 módulos con 14.014 atributos en su documentación del API de búsqueda. Aunque no especifican cómo se ponderan estas características, sí confirman su existencia.
Reajustes y Demociones
Los «twiddlers» son funciones de reajuste que pueden cambiar la puntuación de recuperación de información o el ranking de un documento. Los contenidos pueden ser degradados por diversas razones, como:
- Un enlace no coincide con el sitio de destino.
- Señales de insatisfacción del usuario en las SERP.
- Reseñas de productos.
- Ubicación.
- Dominios de coincidencia exacta.
- Contenido para adultos.
Historial de Cambios
Google mantiene una copia de cada versión de cada página que ha indexado, utilizando las últimas 20 modificaciones para analizar enlaces. Esto permite a Google «recordar» cada cambio realizado en una página.
Importancia de los Enlaces
Los enlaces siguen siendo cruciales. La diversidad y relevancia de los enlaces son claves, y PageRank todavía juega un papel importante. El PageRank de la página de inicio de un sitio es considerado para todos los documentos.
Clics Exitosos
Los documentos confirman que Google mide varios tipos de clics (badClicks, goodClicks, lastLongestClicks, unsquashedClicks) para determinar la calidad del contenido. Además, los documentos más largos pueden ser truncados, mientras que el contenido más corto recibe una puntuación basada en su originalidad.
Datos Específicos de Interés
Uso de Datos de Chrome
Un módulo llamado ChromeInTotal sugiere que Google utiliza datos de su navegador Chrome para el ranking, algo que Google había negado públicamente.
Importancia de la Marca
Fishkin destaca que la marca es un factor crucial. Construir una marca notable y bien reconocida fuera de Google puede mejorar significativamente los rankings de búsqueda orgánica.
Entidades y Autoría
Google almacena información de los autores asociados con el contenido e intenta determinar si una entidad es el autor del documento. También utiliza algo llamado «siteAuthority» para evaluar la calidad del contenido de un sitio en su totalidad.
Listas Blancas
Google tiene módulos que indican que ciertos dominios están en listas blancas relacionadas con elecciones y COVID-19, lo cual sugiere un tratamiento preferencial en estos contextos.
Tratamiento de Sitios Pequeños
Un módulo denominado smallPersonalSite podría indicar que Google ajusta el ranking de pequeños sitios personales o blogs, aunque esto sigue siendo una especulación sin confirmación sobre su peso real en el algoritmo.
Otros Hallazgos Interesantes
- Frescura: Google considera las fechas en la línea de autor, URL y contenido en la página.
- Título de Página: Google mide cómo el título de una página coincide con la consulta.
- Peso de los Términos: Google mide el tamaño promedio ponderado de los términos en los documentos y el texto del ancla.
Contradicciones con Declaraciones Públicas
Uno de los aspectos más polémicos de la filtración es cómo algunas de las informaciones presentadas entran en conflicto con lo que Google ha afirmado públicamente. Por ejemplo:
Uso de Datos de Chrome
Google ha declarado en repetidas ocasiones que no utiliza datos de Chrome para el ranking de páginas. Sin embargo, los documentos filtrados indican lo contrario, sugiriendo que estos datos pueden influir en la visibilidad de ciertos enlaces.
E-E-A-T: Experiencia, Experticia, Autoridad y Confianza
Google ha sostenido que E-E-A-T no es un factor de ranking directo. No obstante, los documentos filtrados muestran que Google sigue y evalúa los datos de los autores en las páginas, especialmente en artículos de noticias y científicos. Esto implica que la autoría podría tener un impacto indirecto en los rankings, lo que contradice la versión oficial de Google.
Reacciones en la Industria
Fishkin ha criticado la tendencia de algunos medios y voces de la industria de aceptar sin cuestionar las declaraciones públicas de Google. Ha pedido una mayor escrutinio y análisis crítico de las afirmaciones de la empresa. Esta filtración, junto con el juicio antimonopolio del DOJ contra Google, podría cambiar la forma en que la industria ve y reporta las prácticas de Google.
Consecuencias para la Estrategia de SEO
Para los profesionales del SEO, esta filtración es una mina de oro de información. Proporciona pistas indirectas sobre qué factores Google podría valorar más en sus algoritmos. Esto podría influir en la forma en que las empresas optimizan sus sitios web para mejorar su visibilidad en las búsquedas.
Reflexiones Finales
La filtración de documentos de Google ha sacudido la industria tecnológica y de marketing digital. Ofrece una oportunidad para reevaluar cómo se percibe y se confía en la información proporcionada por grandes corporaciones tecnológicas. La transparencia y la veracidad en las comunicaciones de empresas tan influyentes como Google son cruciales para mantener la confianza de los usuarios y profesionales del sector.
Por desgracia, parece que las conclusiones son claras: los sitios pequeños están destinados a desaparecer, dejando que los grandes medios acaparen todos los sectores.