Google Leak: svelati i segreti dell’algoritmo

da | Giu 20, 2024 | Seo

Home 9 Seo 9 Google Leak: svelati i segreti dell’algoritmo

Nel maggio 2024 è scoppiato il caso Google Leak, un evento epocale che conferma molte supposizioni conosciute da chi si occupa di Seo, spesso in contraddizione con le dichiarazioni ufficiali. Alcune API segrete dell’algoritmo del motore di ricerca sono diventate di dominio pubblico e sono state analizzate dai massimi esperti mondiali di Seo. In totale, nel documento di 2.500 pagine proveniente dal Content API Warehouse di Google sono stati raccolti ben 2.596 moduli con 14.014 attributi, individuati come fattori di ranking.

Attenzione! Nei documenti non è indicato quanto ogni fattore pesi sul ranking. In base agli attributi, possiamo però individuare quali elementi vengono considerati dall’algoritmo di Google. Il portavoce di Google, Davis Thompson, ha confermato a The Verge l’autenticità dei documenti, ma ha messo in guardia i lettori dal trarre conclusioni inaccurate. Michael King, fondatore e Ceo di iPullRank, e Rand Fishkin, fondatore di SparkToro ed ex Ceo di Moz, hanno analizzato questi documenti, confrontandoli con le informazioni emerse dal processo dell’Antitrust contro Google. Possiamo così raccogliere importanti conferme sui fattori di ranking.

Dove trovare il documento completo del Google Leak

Il documento, realizzato il 27 marzo 2024, era presente su Github, con accesso riservato ai dipendenti del Content API Warehouse di Google, come da prassi. Inavvertitamente, il 7 maggio la cartella è diventata accessibile. Successivamente, il 24 marzo una fonte anonima ha condiviso il file con Rand Fishkin, il quale ha analizzato i contenuti insieme a Michael King.

Oggi è possibile analizzare nel dettaglio il file del Google Leak sulla piattaforma Hexdocs: il documento è molto lungo e tecnico. Di seguito, pubblico un riassunto degli elementi chiave.

I fattori di ranking più importanti svelati dal Google Leak

Non tutte le affermazioni ufficiali sull’algoritmo di Google erano vere al 100%. È quanto emerge dal file del Google Leak. Di seguito, riporto le evidenze sui fattori di ranking emerse dai documenti riservati.

Entità, autori e brand

Il concetto di entità ha ormai superato quello di keyword. Google ha ormai classificato le informazioni sul web e individuato entità composte da attributi. Queste identificano tutte le informazioni presenti sul web, creando connessioni e una fitta rete di mappe concettuali.

Secondo le informazioni contenute nei documenti del Google Leak, possiamo notare collegamenti di entità con gli autori dei contenuti sul web (che rafforzano le teorie sul modello EAT) e con il brand che acquisisce maggiore autorevolezza in relazione ad argomenti specifici.

Click degli utenti e raccolta dati da Google Chrome

Google analizza i click degli utenti e raccoglie informazioni dal browser Google Chrome. Il file svela il segreto di Pulcinella che tutti conoscevano, nessuno poteva provare e Google negava sempre. Attributi come “badClicks”, “goodClicks”, “lastLongestClicks” e “unsquashedClicks” suggeriscono che viene misurato il clickstream dell’utente su un sito e questo ha effetti sul posizionamento.

Ne è responsabile il twiddler di re-ranking navBoost, il quale analizza i log dei click degli utenti, identificando quelli naturali, forzati e di spam e attribuendo valore alle azioni e alla durata della sessione o al tempo sulla pagina. Google Chrome contribuisce a fornire informazioni utili all’algoritmo. Questo aspetto non dovrebbe essere una sorpresa per chi è abituato ad utilizzare lo strumento Page Speed Insight. Da qui, per esempio, Google raccoglie informazioni utili per creare sitelink verso le pagine più viste del sito web.

Autorità del sito, sandbox e temi delicati

Nel 2011, dopo il rilascio del Panda Update, si iniziava a parlare di Site Authority, molti strumenti come Semrush, SeoZoom o Moz hanno inserito questa variabile nei report (cercando di ipotizzare quali potessero essere gli attributi considerati dall’algoritmo) e i Googlers hanno continuato a negare a lungo la sua esistenza. oggi nei documenti riservati compare la voce “siteAuthority”. Questo elemento raccoglie informazioni utili per definire la rilevanza e l’autorevolezza di un dominio. L’età è una di queste, come lascia intuire l’attributo “hostAge”. Dunque l’effetto sandbox, che penalizza i nuovi siti su parole chiavi con molta concorrenza, esiste!

In aggiunta a questo, sappiamo con certezza che Google non dimentica. L’attributo “CrawlerChangerateurlhistory” ci informa che il motore di ricerca archivia copie delle precedenti versioni delle pagine, in modo da penalizzare le pratiche Seo fraudolente.

Inoltre, identifica i siti web per tipologia. Questo è il caso dei blog personali che hanno obiettivi diversi da un sito corporate o di informazione e sono etichettati come “smallPersonalSite”. Per temi delicati legati all’attualità, come il Covid e le elezioni politiche, ha invece aggiunto delle liste di eccezioni, tramite gli attributi “isCovidLocalAuthority” e “isCovidLocalAuthority” che sottopongono le pagine a maggior controllo.

La link building influisce sul posizionamento Seo

Un grande tema divisivo tra gli esperti Seo è quello della link building. I documenti segreti ci dicono che i backlink sono un fattore di ranking su Google. Non sappiamo quanto incidono, ma abbiamo la conferma hanno un valore. Diversi aspetti tra quelli discussi in precedenza influiscono sul valore dei link: tra questi, il conteggio dei click su Google Chrome e e la rilevanza secondo la mappa delle entità.

I feedback dei Quality Raters determinano la pertinenza dei contenuti

Google aggiorna periodicamente il documento con le linee guida per i quality rater e ha utilizzato per molto tempo la piattaforma di quality rating EWOK (stesso nome delle buffe creature della saga di “Guerre Stellari”). Il modulo “GoogleApi.ContentWarehouse.V1.Model.RepositoryWebrefDocLevelRelevanceRatings” rivela che le valutazioni umane dei quality rater vengono effettivamente utilizzate. In particolare, indica se i contenuti vengono considerati rilevanti e comprensibili.

Ottimizzazione Seo: cosa ci raccontano i documenti del Google Leak

Abbiamo visto i più importanti fattori di ranking che emergono dai documenti del Google Leak. In realtà, non sappiamo quanto ognuno di essi incida e nel file ce ne sono molti altri di portata minore. Da tutto questo, possiamo ricavare 5 best practice per chi si occupa di Seo, contenuti e digital marketing:

  • prenditi cura del brand e di come viene percepito online;
  • fai attività di link building interna ed esterna e di digital PR;
  • cerca di ottenere traffico attraverso diversi canali: ricerca organica, social, pubblicità, newsletter e referral;
  • favorisci un percorso di navigazione interno con un menu chiaro, touchpoint rilevanti e risorse correlate di grande valore;
  • crea contenuti pertinenti e di qualità.
Luigi Nervo

Luigi Nervo

Digital Marketing Manager

Esperto di marketing, Seo e contenuti (leggi la bio).

Metiamoci in contatto

Vuoi aggiungere valore alle tue attività di digital marketing?

Mettiamoci subito in contatto! Mi trovi su LinkedIn, oppure puoi scrivermi compilando il form che segue.

Spero di sentirti presto.

13 + 2 =

Luigi Nervo

Luigi Nervo

Digital Marketing Manager

Esperto di marketing, Seo e contenuti (leggi la bio).