Google Leak mayo 2024: secretos del buscador que salen a la luz

Google algo Leak - nicoseosem.com

Y boom, esta mañana, el anuncio simultáneo tuvo un efecto bombazo en el pequeño mundo del SEO mundial… ay, ay, ay Google, siempre tan transparente y honesto… o no.

De hecho, los «kin» del SEO, es decir, Ran Fishkin y Mike King, revelaron algunos de los secretos más profundos del algoritmo de búsqueda de Google disponible aquí.

Voy a destacar algunos de los más relevantes.

 

La autoridad de dominio

Predica con el ejemplo…

Google ha negado durante mucho tiempo utilizar una métrica específica de autoridad de dominio. ¡Sorpresa! Internamente, utilizan, o al menos existe en 2024, algo llamado ‘siteAuthority’. ¿Y qué hace esta métrica?

Evalúa la credibilidad y la autoridad de un dominio, influyendo fuertemente en las posiciones en el motor de búsqueda.

Aunque Google niega públicamente estas métricas, parecen usarlas discretamente para decidir qué sitios merecen las mejores posiciones.

Évidemment, ce n’est pas l’Authority Score ou le Domain Authority qui est employé… tout simplement car c’est impossible de savoir quels sont les sites pris en compte et ignorés par Google. En d’autres termes, il est impossible de reproduire le Page Rank externe comme Google.

La influencia de los enlaces en las posiciones en SERP (páginas de resultados de motores de búsqueda)

Calidad de los enlaces y sistemas de ranking

Los enlaces juegan un papel crucial en la clasificación de las páginas. Google usa datos de clics para evaluar la calidad de los enlaces, clasificándolos en tres categorías:

  • Baja
  • Media
  • Alta calidad

Los enlaces de alta calidad influyen positivamente en la clasificación.

Sistemas como NavBoost y Panda integran datos de clics para ajustar los puntajes de calidad de los sitios. Y ahí… esto contradice las declaraciones públicas de Google sobre el uso de datos de clics para el ranking en SERP. Ya habíamos tenido esta declaración durante el juicio antimonopolio de Google en noviembre de 2023:

https://www.justice.gov/d9/2023-11/417508.pdf

Valor de los enlaces e indexación

Contrariamente a los «rumores», es decir, las declaraciones de John Mueller, según las cuales los enlaces serían menos importantes, los documentos muestran que Google continúa otorgando… al contrario… una gran importancia a los enlaces.

El sourceType de las páginas indica que el valor de los enlaces depende de dónde se indexe la página:

  • Los contenidos más importantes y regularmente actualizados se almacenan en memorias flash.
  • Los contenidos menos importantes en discos SSD.
  • Los contenidos rara vez actualizados en discos duros estándar.

Cuanto más alta sea la categoría de la página, más valioso será el enlace.

Esto explica por qué los enlaces provenientes de páginas bien clasificadas y de páginas de noticias tienen un impacto significativo en el rendimiento de las posiciones en SERP.

En otras palabras, si obtienes un enlace desde una página con un alto Índice de Visibilidad (Sistrix), más probabilidades tienes de clasificar mejor.

Detección de enlaces de spam

Google dispone de varias métricas para identificar los picos de spam en los textos ancla, como el phraseAnchorSpamDays. Esto permite medir la velocidad del spam de enlaces y neutralizar los ataques de SEO negativo.

Historial de cambios de enlaces

Google toma en cuenta los últimos 20 cambios para una URL dada cuando analiza los enlaces. Esto significa que, para obtener un ‘nuevo comienzo’ a los ojos de Google, es necesario cambiar e indexar la página varias veces. Lo que puede explicar el éxito o no de un dominio expirado completamente resurgido idéntico o no.

Clics y comportamiento después del clic

NavBoost y Glue

Google jura que los clics de los usuarios no afectan las clasificaciones. Excepto que en el documento… entran en escena NavBoost y Glue.

Sabíamos esto desde el juicio:

Navboost, « uno de los elementos de clasificación más poderosos » en Google, memoriza todos los clics para todas las consultas recibidas en los últimos 13 meses.
Google – memoriza todos los clics para todas las consultas recibidas en los últimos 13 meses anteriores (citando UPX0190 a -740). Le tomaría a Bing más de 17 años generar una cantidad similar de datos. Luego, Google utiliza un sistema llamado Glue para ayudar a clasificar los resultados de páginas enteras. Glue también se basa en enormes cantidades de datos de usuarios.

Fuente (y declaraciones de Pandu Nayak)

Estos sistemas analizan los clics de los usuarios y el comportamiento post-clic para ajustar las posiciones.

NavBoost observa cómo los usuarios navegan en los resultados de búsqueda, mientras que Glue considera cuánto tiempo permanecen los usuarios en una página… y, por ejemplo, qué tipo de clics hacen. Además, también tenemos métricas como la velocidad de carga de las páginas y la interacción de los usuarios recopiladas a través de Chrome, que se utilizan efectivamente para evaluar la calidad de las páginas.

A pesar de las afirmaciones de Google, tenemos la confirmación de que existen herramientas para evaluar el compromiso de los usuarios y que juegan un papel, por lo menos… significativo.

La Sandbox o lo que llamo… el período de gestación SEO: HostAge revelado

Una especie de novatada para los nuevos sitios

Sandbox - nicoseosem.com

 

Muchos expertos en SEO sospechaban desde hace tiempo la existencia de un efecto sandbox o periodo de gestación SEO, durante el cual los nuevos sitios tienen dificultades para obtener visibilidad.

Los documentos filtrados confirman esta observación de Sistrix. Muestran cómo Google utiliza un atributo llamado «hostAge» para monitorear y a veces penalizar los nuevos sitios. Este período de prueba está destinado a eliminar los sitios potencialmente spammy, pero lo molesto es que a menudo atrapa a sitios legítimos en sus redes.

Análisis detallado de datos y señales

También tenemos un documento interesante que ofrece un análisis detallado de los diferentes datos y señales utilizados para mejorar el rendimiento SEO, desde puntuaciones de spam y clasificaciones PageRank hasta metadatos e información de documentos.

 

Spam y puntuaciones de spam

El mundo del SEO a menudo se enfrenta a los estragos del contenido no deseado, lo que requiere herramientas precisas para detectarlo y neutralizarlo.

Por ejemplo, el uacSpamScore evalúa rigurosamente el nivel de spam en una escala de 0 a 127, un dato crucial para preservar la calidad de un sitio. Las señales como spamMuppetSignals juegan un papel esencial en la identificación de sitios pirateados, evitando que contenido dañino invada la web.

Con herramientas como trendspamScore, se pueden cuantificar las consultas relacionadas con el spam de tendencia, mientras que las puntuaciones ScaledSpamScoreYoram y ScaledSpamScoreEric afinan los filtros para una detección más precisa.

El uso del algoritmo IsAnchorBayesSpam, que se basa en métodos bayesianos, aporta una precisión quirúrgica a la identificación del spam.

Finalmente, el spambrainTotalDocSpamScore compila todas las puntuaciones de spam de un documento, ofreciendo una vista general indispensable para garantizar la calidad del contenido.

 

PageRank y clasificaciones

En el universo algorítmico del SEO, el PageRank y la clasificación en la página de búsqueda de Google determinan la visibilidad y la credibilidad de las páginas web. Las variantes experimentales de PageRank como pagerank1, pagerank2 y pagerank0 exploran diversos aspectos del algoritmo para una optimización continua.

El homepagePagerankNs mide la popularidad de la página de inicio, un indicador clave para aumentar la visibilidad en los motores de búsqueda.

Las clasificaciones de independencia como ScaledIndyRank y ScaledExptIndyRank2 evalúan la originalidad de las fuentes, garantizando que los contenidos auténticos sean favorecidos.

La normalización de rangos por idioma, gracias a scaledSelectionTierRank, asegura una evaluación equitativa de los contenidos multilingües.

Estas métricas son fundamentales para determinar qué páginas aparecen en la cima de los resultados de búsqueda, influyendo directamente en el tráfico orgánico.

Ejemplo de aplicación: Puedes mejorar la visibilidad de tu blog de viajes optimizando su popularidad al publicar contenido original y muy buscado. Verifica la originalidad de tus fuentes y asegúrate de que no estén sobreutilizadas por otros sitios.

 

Idioma y localización

El dominio de los idiomas y las localizaciones es indispensable para adaptar los contenidos a su contexto cultural y geográfico.

videoLanguage identifica automáticamente el idioma de audio de los videos, simplificando la clasificación y búsqueda de contenidos.

Los códigos de idioma proporcionados por rosettaLanguages y s3AudioLanguage para documentos y archivos de audio, respectivamente, son esenciales para una organización eficiente. localizedCluster agrupa los contenidos según su ubicación geográfica, y countryInfo especifica el país de origen del documento, información crucial para adaptar el SEO a audiencias específicas.

watchpageLanguageResult y saftLanguageInt clasifican los documentos por idioma principal, mejorando así la relevancia de los resultados de búsqueda.

Ejemplo de aplicación: Adapta el contenido de tu sitio de venta en línea a los diferentes idiomas y países utilizando la identificación automática del idioma de audio y la información sobre el país de origen. Esto te permite ofrecer descripciones de productos y materiales de marketing en el idioma y contexto cultural de cada mercado objetivo, aumentando así la relevancia y las ventas.

 

Datos y señales

Los datos y señales son la piedra angular para analizar y clasificar eficazmente los documentos web. phildata y kaltixdata representan datos específicos, a menudo internos, que alimentan los algoritmos de indexación.

webrefEntities lista las entidades asociadas a un documento, facilitando la categorización.

Las anotaciones como knexAnnotation y v2KnexAnnotation mejoran la indexación, haciendo que los contenidos sean más fáciles de encontrar.

Los datos de sesgo, biasingdata y biasingdata2, permiten corregir o ajustar los resultados de búsqueda para una mayor precisión.

Finalmente, nsrDataProto y nsrSitechunk ofrecen señales a nivel del sitio, ayudando a evaluar la calidad y relevancia globales de los sitios web.

Ejemplo de aplicación: Utiliza anotaciones para estructurar los artículos de tu sitio de noticias, esto hará que los contenidos sean más fáciles de encontrar por los motores de búsqueda. Integra las entidades asociadas al sitio para vincular los artículos a entidades reconocidas: esto mejorará su posición en SERP, además de la credibilidad.

Metadatos e información de documentos

Los metadatos y la información sobre los documentos son indispensables para una organización y comprensión profundas de los contenidos web.

datesInfo y semanticDate proporcionan información sobre las fechas de creación y actualización, esenciales para evaluar la frescura de los contenidos. lastSignificantUpdate y lastSignificantUpdateInfo indican las últimas actualizaciones importantes, permitiendo seguir la evolución de los documentos.

queriesForWhichOfficial identifica las consultas para las cuales un documento se considera oficial, reforzando su credibilidad.

domainAge y hostAge proporcionan información sobre la antigüedad del dominio y del host, indicadores de confiabilidad. Estos metadatos estructuran y priorizan la información, facilitando su descubrimiento y uso por los motores de búsqueda.

Ejemplo de aplicación: Mantén tu sitio educativo actualizado utilizando la información sobre las últimas actualizaciones para seguir y mostrar las últimas modificaciones del sitio. Indica en la medida de lo posible la fecha de creación del contenido y asegúrate de que la información siga siendo relevante y confiable para estudiantes y profesores.

Datos técnicos y de rendimiento

Los datos técnicos y de rendimiento son fundamentales para la eficacia y estabilidad de los contenidos en línea.

Event y extraData ofrecen información de depuración crucial para la mejora continua de los sistemas internos.

crawlerIdProto y launchAppInfo proporcionan contextos detallados sobre los identificadores de los robots de exploración y los lanzamientos de aplicaciones, ayudando a optimizar los procesos.

Las señales de fireflySiteSignal y spambrainDomainSitechunkData evalúan la calidad de los sitios web.

coldAnomalyDetection detecta anomalías, reforzando la estabilidad de las infraestructuras. Estos datos son esenciales para mantener un rendimiento óptimo y una experiencia de usuario fluida.

Ejemplo de aplicación: Optimiza el tiempo de carga y la estabilidad de tu sitio de comercio electrónico utilizando herramientas de depuración para identificar y corregir errores. Esto mejorará la experiencia de compra de tus clientes y reducirá las tasas de abandono del carrito.

 

Datos multimedia

Los datos multimedia abarcan información relacionada con imágenes, videos y otros contenidos audiovisuales. imagedata y videodata proporcionan metadatos específicos para los archivos, facilitando su gestión y búsqueda.

videoCorpusDocid y s3AudioLanguage asignan identificadores y lenguas principales a los archivos multimedia, asegurando una organización eficaz.

liveResultsData ofrece información sobre los resultados en directo, relevante para eventos temporales.

videoLanguage y watchpageLanguageResult clasifican los contenidos de video por idioma, permitiendo una mejor personalización de los resultados. Estos datos son cruciales para gestionar y explotar eficazmente los contenidos multimedia.

Ejemplo de aplicación: Inserta videos y mejora el SEO de los videos de tu sitio de tutoriales en línea utilizando metadatos específicos. No olvides organizar y describir los contenidos de manera precisa. Además, esto hace que los videos sean más fáciles de encontrar para los usuarios y los motores de búsqueda.

 

Datos diversos

Los datos diversos cubren información variada esencial para el enriquecimiento de las bases de datos.

BookCitationData incluye datos de citas de libros, cruciales para las referencias académicas.

travelGoodSitesInfo y productSitesInfo proporcionan información sobre los mejores sitios de viajes y productos, ayudando a orientar a los usuarios.

oceandata y geodata contienen información geográfica y oceánica, útil para aplicaciones especializadas.

GroupsData ofrece datos sobre los grupos, relevantes para las redes sociales. Esta información diversa enriquece las bases de datos, mejorando la relevancia de los servicios en línea.

Ejemplo de aplicación: Enriquece los recursos de tu sitio de investigación académica añadiendo información geográfica relevante. Esto facilita el trabajo de los investigadores al ofrecerles recursos completos y precisos.

 

Algunas grandes lecciones que comparto con Ran y Mike

El branding

Este fue el tema de mi última conferencia durante el SEOCamp ‘us Paris 2024: al leer los artículos completos y parte de la filtración, nos damos cuenta de que Google dispone de muchos medios para identificar, clasificar y filtrar entidades (un gran tema), especialmente las marcas.

Hemos observado claramente a través de las actualizaciones (al menos desde mayo de 2022) que esta tendencia continúa, especialmente en favor de las grandes marcas. Para mejorar las posiciones en los SERPs y tu tráfico orgánico, lo repito una vez más: construye una marca notable, popular y bien reconocida… fuera de Google (consulta mi conferencia para saber cómo hacerlo).

 

E-E-A-T: ¿Mito o realidad?

La experiencia, la experiencia, la autoridad y la confianza (también conocida como fiabilidad) (el famoso E-E-A-T) son conceptos a menudo elogiados en SEO, pero su importancia real sigue siendo confusa.

Aún así, tenemos un modelo llamado RepositoryWebrefEntityJoin que ayuda a Google a reunir toda la información sobre una entidad específica, como una persona o un lugar.

Utiliza identificadores únicos para reconocer la entidad y recopila datos de diferentes fuentes, con el fin de comprender y describir mejor esta entidad. Este sistema permite agrupar nombres, páginas web asociadas y otros detalles importantes para ofrecer una visión completa de la entidad.

Y lo ves en el knowledge graph.

 

Todos los indicios nos hacen pensar que esto puede tener un impacto en el ranking. Es incierto, de acuerdo, pero aún así… estoy dividido (¿es propaganda o elementos sustanciales?) En cualquier caso, existe formalmente.

 

La intención de los usuarios como factor

Volviendo a lo básico… los títulos de página siguen siendo importantes, pero las intenciones de navegación de los usuarios se han convertido en factores poderosos de clasificación.

Si un grupo de usuarios muestra una fuerte preferencia por un cierto resultado, Google ajustará los SERPs en consecuencia, superando todas las señales SEO clásicas como enlaces y contenido optimizado.

¿Recuerdas las pruebas de SEOs que pedían hacer clic en ciertos resultados… y de repente… la posición cambiaba? Bueno, aquí está la confirmación en la filtración.

Los sistemas como NavBoost utilizan estos datos para influir significativamente en los resultados en los SERPs.

 

La guirnalda de penalizaciones algorítmicas

¡Dicen degradaciones! … ¡Es una condena si tu sitio depende del tráfico de Google!

Antes de terminar, otro punto interesante en los documentos filtrados menciona una serie de «degradaciones algorítmicas«.

Es un modelo llamado CompressedQualitySignals que agrupa diversas señales de calidad para las páginas web. Utiliza indicadores para evaluar la calidad de las páginas, como puntajes de promoción o degradación de autoridad y críticas de productos, así como señales experimentales para probar nuevos componentes de calidad.

Entre las penalizaciones que apuntan a aspectos específicos, aquí hay algunas:

  • Anchor Mismatch: cuando un enlace no corresponde al sitio de destino: Penalización. Por ejemplo, si el texto del enlace dice «perros lindos» pero la página vinculada habla de «reparación de coches», hay un desajuste.

 

  • SERP Demotion: Penalización basada en factores observados en los SERP, sugiriendo una posible insatisfacción de los usuarios. Por ejemplo, un sitio de recetas expirado que anteriormente aparecía en la primera página de resultados de búsqueda para «mejores recetas de pasteles de chocolate», pero que ha cambiado de temática y de repente se encuentra relegado a la tercera página. Esto puede suceder si Google detecta que el sitio utiliza prácticas engañosas, como contenido duplicado, o si la calidad general del contenido ha disminuido, provocando una experiencia de usuario negativa.

 

  • Nav Demotion: Penalización aplicada a las páginas que presentan malas prácticas de navegación o problemas de experiencia del usuario. Por ejemplo, elementos como una mala estructura de navegación, menús confusos o una arquitectura del sitio complicada, que pueden perjudicar la experiencia del usuario.

 

  • Exact Match Domains Demotion: Desde 2012, los dominios de coincidencia exacta ya no son tan valorados como antes. De hecho, sufrí esto cuando mi EMD de pasteles de golosina fue penalizado en 2012 🙁

 

  • Product Review Demotion: Reseñas que carecen de detalles, que parecen sesgadas o no auténticas, o que no aportan un valor real a los usuarios.
  • Location Demotions: Por ejemplo, si un sitio web no proporciona información correcta sobre las ubicaciones físicas o si los datos de ubicación son engañosos.

 

  • Scamness: Esta penalización afecta a los sitios web identificados como potencialmente fraudulentos o engañosos.

 

  • Baby Panda Demotion, su versión V2, VLQ (Very Low Quality) NSR y Low Quality: para contenido de baja calidad.

 

Para evitar estas penalizaciones y mejorar nuestro ranking en los resultados de búsqueda de Google, siempre la misma historia: hay que centrarse en la creación de contenido de alta calidad, una buena experiencia de usuario, y proporcionar información precisa y auténtica.

 

Detrás del telón de Google

A la luz de las revelaciones sorprendentes de Ran Fishkin y Mike King, queda claro que Google maneja sus algoritmos con una opacidad controlada, muy lejos de la transparencia proclamada. Las métricas de autoridad ocultas, el uso no declarado de los datos de Chrome, y las manipulaciones a través de NavBoost y Glue dibujan un panorama del SEO donde el engaño y la contradicción reinan.

Para los SEO y los propietarios de sitios web, esta información revela dinámicas ocultas esenciales para comprender. La creación de contenido de calidad, la experiencia de usuario optimizada, y una vigilancia constante sobre las prácticas de Google se vuelven más cruciales que nunca. La ruta hacia la cima de los SERPs no es una línea recta, sino un laberinto donde cada giro está dictado por algoritmos secretos y métricas invisibles.

Así que la próxima vez que trabajes en la optimización de tu sitio, recuerda: la realidad de Google es mucho más compleja de lo que parece. Navegar con éxito en este ecosistema requiere una comprensión profunda de las fuerzas ocultas que influyen en las posiciones en los SERPs. Guíate por el Índice de Visibilidad como único faro para gestionar tu marca y no solo tu sitio. Mantente alerta y adapta tus estrategias en consecuencia, porque son estas sutilezas las que podrían ser la clave de tu éxito.

 

La persona a la fuente del leak es Erfan Azimi. Explica sus motivos de desvelo:

Ce type d'article par mail ?

Ne perds plus de temps, ajoute ton mail pour recevoir la newsletter

¡Pas de spam! => política de privacidad pour plus d'infos.

SEO / Online Marketing Manager France & España en NicoSEOsem | +34 644 350 730 - +33 7 81 51 86 45 | Web | + posts

After gaining experience in international trade, I have embarked on a diverse journey through digital marketing roles. This has included providing support for a classified site, working in SEO, handling email marketing for a SaaS company, steering online marketing for an E-commerce business, and serving as the CMO for a startup, before eventually becoming the director of online marketing for a marketing agency. This extensive experience led me to start my own venture.

Since 2011, I've been an SEO, SEM, and Inbound Marketing consultant based in Barcelona. My mission is to assist French and Spanish companies in transcending the barriers presented by the Pyrenean mountains to achieve success in their markets.

Compartir

Facebook
Twitter
LinkedIn