Google Leaks - Los 14 secretos del algoritmo que hemos aprendido

Por Emilio Rodríguez

 

Rand Fishkin, ex-SEO y fundador del portal Moz, viralizó una filtración de documentos presuntamente de Google. Unos días después se ha obtenido una respuesta oficial, confirmando la autenticidad de dichos documentos y pudiendo prudencia al no tener todo el contexto: "Recomendamos tener cuidado con las suposiciones inexactas sobre la Búsqueda basadas en información descontextualizada, desactualizada o incompleta".

La documentación, repartida en más de 2.500 documentos, cuenta con algunos registros actualizados a 2023, por lo que podríamos concluir que algunas de las partes están bastante actualizadas. Esta información describe los datos con los que funciona la Search API de Google, proporcionando información sobre cerca de 14,000 atributos y funciones del algoritmo de Google utilizados para mejorar las búsquedas.

Es importante aclarar que cualquier conclusión es pura especulación y que debemos ser prudentes con la información que se extrae de la documentación. Como siempre decimos, la mejor aproximación que podemos hacer es probar, experimentar y analizar resultados para entender cuál es el mejor curso SEO para nuestro proyecto. 

Aun así, analizando lo que Google considera sumamente importante como para almacenarlo en sus sistemas, podemos obtener algunas conclusiones interesantes. 

Hallazgos relevantes

Tras analizar de cerca estos documentos, se han realizado algunos hallazgos interesantes.

  • Importancia de los clics: Aunque ya lo sabíamos a raíz del juicio antimonopolio, se constata que Google utiliza datos de clics de los usuarios para clasificar los sitios web, filtrando clics no deseados y midiendo la duración de estos (rebote a una nueva búsqueda). Emplean segmentación geográfica y datos del navegador Chrome para mejorar la precisión de los resultados.

  • Sistema NavBoost: Este sistema, sumamente importante en el posicionamiento, utiliza la cantidad de búsquedas de una palabra clave para identificar tendencias, el número de clics en un resultado y la proporción entre clics largos y cortos. Además, contribuye a la alineación con la intención de búsqueda, por ejemplo, asociando ciertas consultas con una preferencia por imágenes o vídeos. NavBoost también se emplea a nivel de dominio para evaluar la calidad de los sitios web; los datos y puntuaciones generados por este sistema se integran directamente en los sistemas de búsqueda de Google, probablemente alineados con el EEAT.

  • Análisis antes y después de la búsqueda: Google analiza y relaciona búsquedas posteriores a la principal. Por ejemplo, si busco "SEO" y luego realizo una segunda búsqueda "Smartup" y hago clic en smartupdigital.com, es posible que, si se detecta ese patrón, la página de Smartup comience a posicionarse para la búsqueda de "SEO", dado que NavBoost entenderá que existe una asociación.

  • Navegador Chrome: Utiliza el historial de cookies y los datos de navegación y clics de los usuarios para combatir el spam de clics (clics fraudulentos).

  • Clasificación de enlaces: Los enlaces se clasifican en baja, media y alta calidad según los datos de clics, afectando la transmisión de PageRank y la detección de spam.

  • Autoridad del sitio: Aunque Google evita el término "autoridad de dominio", mide la autoridad de los sitios mediante una métrica llamada "siteAuthority".

  • Valor de los enlaces: Estratifica su índice en niveles, valorando más los enlaces de páginas bien posicionadas o de portales de noticias.

  • EEAT y contenido: Evalúa la originalidad del contenido con métricas como OriginalContentScore y titlematchScore. Se da importancia a la visibilidad del autor para diferenciar el contenido humano del automático. Se revela que el autor tiene relevancia para el algoritmo.

  • Enfoque en vídeo: Los sitios con más del 50% de sus páginas con vídeo pueden recibir un tratamiento especial en los algoritmos de Google.

  • Sitios pequeños: Google etiqueta a los "pequeños sitios personales" y los trata de manera diferente en los resultados de búsqueda, posiblemente para reducir su visibilidad frente a los grandes.

  • Penalizaciones: Hay penalizaciones para dominios que coinciden exactamente con consultas de búsqueda no relacionadas con una marca, por ejemplo: mejores-relojes-lujo.com.

  • Whitelists: Durante la pandemia y eventos electorales, Google utilizó listas blancas para favorecer ciertos sitios. También maneja listas negras para penalizar sitios que no cumplen sus prácticas.

  • La importancia de la marca. Google prefiere ofrecer resultados de una fuente fiable y contrastada antes de otra a la que no conoce tanto. Invertir en nuestra marca ayudará a poner en contexto y valor lo que generamos y representamos. Para pequeñas empresas o páginas nuevas, seguramente no se vean grandes resultados hasta que se haya establecido credibilidad y una sólida reputación entre una audiencia considerable.

  • El título sigue siendo un factor relevante para posicionar. Otros factores como los anchor text de los enlaces o la relación de términos de búsqueda con contenidos han ido perdiendo relevancia.
Si tuviera que destacar lo más relevante, me enfocaría en la generación de demanda de usuarios hacia nuestros contenidos y marca. En otras palabras, si logramos crear interés por nuestro sitio web entre un número suficiente de usuarios, Google reconocerá ese patrón y mejoraremos en los rankings sin importar (tanto) otros factores. Esto nos alineará con NavBoost, que considero es el núcleo del algoritmo de Google.