I SEO stanno sottovalutando la perdita di Yandex?

Pubblicato: 2023-04-01

Molti SEO si sono affrettati a respingere la perdita del codice sorgente di Yandex. C'è qualcosa che gli manca? Oppure i SEO stanno sottovalutando ciò che la fuga di notizie potrebbe aiutarli a imparare e capire sulla SEO?

Ecco un piccolo retroscena:

Verso la fine di gennaio (2023), è stato riferito che alcuni hacker hanno messo le mani su circa 45 GB di codice sorgente Yandex, inclusi i loro coefficienti (pesi) e l'elenco dei fattori di classificazione.

È l'equivalente di scoprire gli algoritmi di ricerca di Google. C'era molto clamore intorno a questo, e gran parte della comunità SEO ha lavorato 24 ore su 24 cercando di decodificare il materiale.

Tuttavia, non è stato senza qualche dubbio Thomas, pronto a respingere la fuga di notizie con argomenti come:

  • Yandex non è Google
  • Non possiamo accertare se la perdita è reale
  • Cos'è questa ossessione per i fattori di ranking?
  • Quella è solo una copia. Yandex ha raschiato Google.
  • La perdita è solo una piccola parte del codice sorgente di Yandex. Non dice nulla su come Yandex classifica i siti web.
  • Non c'è niente di nuovo qui.
  • Il repository del codice è obsoleto

Questo urla ignoranza o hanno ragione?

La perdita potrebbe non essere completa, ma è comunque utile. Anche se il codice è datato, rivela come si sono evoluti i motori di ricerca.

La maggior parte di noi non ha mai incontrato informazioni migliori su come funzionano i moderni motori di ricerca. Gran parte di ciò che sappiamo è pura speculazione.

La nostra opinione: la reazione che vediamo si basa principalmente sulla paura dell'ignoto, sull'aver torto, avere meno spazio per l'interpretazione e sprecare tempo e fatica.

Essere cauti va bene, ma respingere apertamente la fuga di notizie urla ignoranza.

Non lasciarti indietro: tuffiamoci ed esploriamo.

Le obiezioni più comuni alla fuga di codice sorgente di Yandex

The Most Common Objections to the Yandex Source Code Leak | MediaOne Marketing Singapore

Alcuni SEO si sono affrettati a trascurare il potenziale di questa fuga di notizie, con alcune interessanti obiezioni. Esaminiamo questi argomenti e vediamo se reggono.

Obiezione 1: Yandex non è Google

Yandex e Google sono infatti due motori di ricerca molto diversi. Ma troverai alcune sovrapposizioni quando confronti i loro risultati di ricerca.

Eseguiamo alcune query di ricerca e confrontiamo i risultati. Ad esempio, cerca "le migliori carte di credito" su Yandex e Google.

Ecco i primi dieci risultati:

Le migliori carte di credito
Google Yandex
Posizione 1 Le migliori carte di credito Singapore 2023 | Applica ora! – MoneySmart Le migliori carte di credito Singapore 2023 | Applica ora! – Denaro intelligente
Posizione 2 Le migliori carte di credito a Singapore 2023 – Value Champion 5 migliori piani di carte di credito a Singapore per tutte le esigenze (2021) - Bestinsingapore
Posizione 3 Le migliori promozioni per le carte di credito a Singapore (marzo 2023) – Sing Saver Le migliori carte di credito a Singapore per il 2023 | Finder Singapore – finder.com
Posizione 4 Le migliori carte di credito a Singapore 2023 – Seedly Confronta le migliori carte di credito a Singapore [2023] - Finty
Posizione 5 I migliori bonus di iscrizione con carta di credito a Singapore (marzo 2023) – Suite Smile 5 migliori carte di credito a Singapore per la spesa complessiva (2023) - Prestito istantaneo
Posizione 6 Confronta le migliori carte di credito a Singapore [2023] - Finty Carte di credito a Singapore: offerte febbraio 2023 | Canta Saver
Posizione 7 Confronta le carte di credito Singapore – DBS Bank Le 5 MIGLIORI carte di credito a Singapore 2021 - YouTube
Posizione 8 Richiedi una carta di credito tramite Trust | Banca fiduciaria di Singapore Le migliori carte di credito per acquisti online e pagamenti mobili: campione di valore

Come puoi vedere, metà dei risultati sono gli stessi.

1/10 dei risultati mantengono la stessa posizione.

Ora facciamo lo stesso con altre parole chiave e vediamo come si accumulano:

Parole chiave Il numero di risultati simili tra i primi 10 Il numero di risultati con la stessa posizione
Le migliori carte di credito a Singapore 5/10 1/10
I migliori hotel di New York 6/10 0/10
Il miglior software CRM 2/10 0/10
Come eliminare un ramo in Git 3/10 1/10
Come addestrare un cucciolo al vasino 1/10 1/10
Appartamento con 3 camere da letto a Mosca 5/10 0/10
Sintomi comuni del raffreddore 2/10 0/10

Potresti discutere su quali risultati siano migliori, ma le sovrapposizioni ci dicono qualcosa di interessante. È un segno che esistono fattori di ranking simili in entrambi i motori di ricerca e che non sono completamente diversi.

Quindi, il fatto che Yandex non sia Google non significa che la fuga di notizie sia irrilevante.

Obiezione 2: non possiamo accertare se la perdita è reale

Yandex ha confermato ufficialmente la fuga di notizie, quindi non c'è dubbio che sia successo ( fonte ).

Ma se non ci credi, guarda il repository del codice. Puoi confrontarlo con altri progetti e vedere come la struttura, la formattazione e la sintassi corrispondono a ciò che ti aspetteresti dal codice professionale.

Obiezione 3: Cos'è questa ossessione per i fattori di ranking?

L'ossessione per i fattori di ranking è comprensibile se si considera quanto tempo e denaro vanno nella SEO. È naturale desiderare un vantaggio rispetto alla concorrenza.

LEGGI ANCHE Come avviare un'accademia di apprendimento online?

Conoscere i fattori di ranking può aiutarti a ottimizzare meglio il tuo sito web. Ti dà una comprensione di come funzionano i motori di ricerca e ti consente di adattare i tuoi contenuti di conseguenza.

Obiezione 4: Questa è solo una copia.Yandex ha raschiato Google

Alcuni dei fattori di ranking scoperti dalla fuga di Yandex corrispondono a quelli utilizzati da Google. Ma ciò non significa che Yandex abbia copiato il loro algoritmo.

ottenere l'annuncio di posizionamento di Google

I due motori di ricerca utilizzano metodi diversi per calcolare la pertinenza del contenuto. Yandex ha il suo approccio unico, che puoi vedere nel repository del codice.

Yandex potrebbe aver preso alcune delle migliori pratiche da Google, ma ci sono ancora molti punti di forza unici nel codice.

Obiezione 5: La perdita è solo una minuscola frazione del codice sorgente di Yandex

Potrebbe essere vero, ma ci dà comunque un'idea di come funziona Yandex. Il codice sorgente è una parte importante del puzzle; comprenderlo può fornire informazioni preziose.

L'argomentazione sostenuta dalla maggior parte dei SEO è che è trapelato un solo repository e che un motore di ricerca così gigante non può essere ridotto a un singolo repository di codice.

Bene, anche se la maggior parte del motore di ricerca di Google si basa su un unico repository, è ancora il motore di ricerca più potente del mondo.

fonte

Obiezione 6: Qui non c'è niente di nuovo

In effetti, la maggior parte dei fattori di classificazione scoperti dalla fuga del codice sorgente di Yandex non sono rivoluzionari. Sono cose che già sapevamo e di cui parlavamo da anni.

Ma non è vero:

Ciò che affermiamo di sapere già sono state puramente congetture.

Conosciamo la SEO dalle nostre esperienze, esperimenti, studi teorici, aneddoti, ecc.

Non abbiamo mai visto questi segnali di ranking nel codice sorgente fino ad ora. Questa è la prima volta che i professionisti possono confermare queste teorie e avere prove reali a loro sostegno.

Punti salienti SEO del codice sorgente Yandex

Alcuni SEO si sono presi la responsabilità di studiare il codice sorgente e scomporre ciò che hanno trovato.

Ecco alcuni dei punti salienti:

#1.Elenco dei fattori di classificazione Yandex di Martin MacDonald

Martin MacDonald , autore e fondatore della Web Marketing School, ha compilato un elenco di fattori di ranking Yandex dalla perdita del codice sorgente.

Ha scoperto che ci sono molti più di 1922 fattori di ranking individuali, a partire dal Page Rank (PR) e passando agli elementi basati su testo/contenuto, meta tag, struttura dei link e altro ancora.

Ben Wills ha esaminato il codice e ha calcolato il numero effettivo. Si scopre che Yandex ha 17854 fattori di ranking.

#2.Il 19% dei fattori di ranking si concentra sui segnali degli utenti, il 6% sulla pertinenza dei contenuti e il 6% sui link (di Malte Landwehr)

Malte Landwehr, responsabile SEO di Idealo, ha analizzato a fondo il codice sorgente e ha estratto alcune informazioni preziose.

Ha scoperto che il 19% dei fattori di ranking di Yandex si concentra sui segnali dell'utente (ad es. frequenza di rimbalzo), il 6% sulla pertinenza del contenuto (ad es. densità delle parole chiave) e il 6% sui collegamenti (ad es. qualità del collegamento in entrata).

Le scoperte di Malte sembrano confermare ciò che SEMrush ha riportato quando hanno pubblicato il loro studio sul fattore di ranking che ha mostrato che il traffico verso un sito web aveva il coefficiente di ranking più alto. La comunità SEO li ha rapidamente colpiti, ma i risultati di Malte concordano con la loro affermazione.

#3.C'erano circa 40 fattori di classificazione relativi alla qualità nel codice (Malte Landwehr)

Dalla sua analisi, Malte Landwehr ha anche scoperto che il codice aveva circa 40 fattori di classificazione relativi alla qualità.

Questi fattori di ranking sono stati divisi in tre:

  • Ospite
  • Pagina
  • Testo

Sito/Host/Qualità

Yandex presta attenzione ai dettagli del sito. Esaminano la freschezza media dei contenuti, la qualità media del testo e le prestazioni storiche dei tuoi contenuti (più di 10 fattori). Procedono quindi a classificare il sito di hosting come qualità bassa, accettabile, buona o eccellente.

Le loro regole YMYL sono specifiche dell'host, non specifiche del documento. In altre parole, Yandex esamina i contenuti del tuo sito web in modo olistico piuttosto che pagina per pagina.

Qualità della pagina

Yandex guarda anche alla qualità della pagina stessa.

Esamineranno il codice di stato 404 del contenuto incorporato o collegato. Contrassegneranno la tua pagina come di bassa qualità se il contenuto non viene trovato.

I file video rotti sono i peggiori; Yandex contrassegnerà la tua pagina come di bassa qualità se ne viene rilevata una.

Qualità del testo

Yandex guarda anche il testo su una pagina.

In primo luogo, esamineranno l'occorrenza naturale di verbi, pronomi, aggettivi, sostantivi, avverbi e altre parti del discorso.

Impiegano inoltre vari metodi per rilevare contenuti generati automaticamente e contenuti plagiati.

I fattori di ranking sono specifici della query

È stato a lungo sostenuto che i fattori di ranking sono sempre più specifici per categoria.

Questo è stato vero per Google e altri motori di ricerca, ma Yandex va oltre.

Non solo esaminano la categoria o la parola chiave, ma esaminano anche la query stessa.

LEGGI ANCHE Le migliori app per lo shopping online a Singapore

Il loro codice sorgente include fattori di classificazione statici, binari e specifici della query.

I fattori statici si applicano al sito Web, i fattori dinamici si applicano alla query e i fattori utente sono collegati alla lingua dell'utente, alla cronologia delle ricerche, alla posizione e ad altri dati.

I fattori di classificazione 17854

Martin MacDonald, Ben Wills e Malte Landwehr concordano tutti sul fatto che Yandex abbia fattori di ranking impressionanti.

Insieme, hanno calcolato che ci sono 17854 fattori di ranking individuali.

Questi fattori di ranking sono costruiti attorno a diverse modalità. Tuttavia, da questo, solo il 1922 non è deprecato.

Allo stesso modo in cui gli umani non riescono a comprendere l'impatto dell'interesse composto, è incredibilmente difficile stimare il risultato di questi algoritmi. Aggiungi al mix fattori di classificazione gradiente e binario, specifici per query e specifici per utente e otterrai un incubo algoritmico.

Il reverse engineering diventa quasi impossibile. Il fatto che ci siano così tante parti in movimento, per non dimenticare l'ecosistema web, rende l'algoritmo di Yandex un enorme enigma. Lo rende anche incoraggiante perché mostra che i giganti dei motori di ricerca stanno prendendo in considerazione diversi aspetti di un sito Web per determinarne il posizionamento piuttosto che concentrarsi solo su uno o due aspetti.

Yandex sembra seguire best practice per il recupero delle informazioni simili a quelle di Google

Sebbene il loro algoritmo sia incredibilmente complesso e difficile da decodificare, ci sono somiglianze con le migliori pratiche di Google, come l'indice invertito o gli incorporamenti.

Yandex utilizza anche diversi modelli, come la rete neurale MatrixNet, per determinare i propri coefficienti di rango. Ricorda che MatrixNet era una cosa allora prima che CatBoost lo sostituisse nel 2007.

Sapere come e dove viene utilizzato MatrixNet nel loro algoritmo ti darà un'idea di quanto i motori di ricerca moderni si dedichino all'adeguamento e alla messa a punto dei loro modelli di ranking.

Quindi, i SEO stanno sottovalutando la perdita di Yandex?

Per comprendere le vere implicazioni della fuga algoritmica di Yandex, i SEO devono iniziare a pensare come i ricercatori.

Immagina se i ricercatori avessero la sequenza completa del DNA del cancro nei topi. Usando lo stesso ragionamento usato dai SEO per respingere la fuga di Yandex, sosterrebbero che i topi non sono umani e le sequenze di DNA sono inutili?

Ovviamente no.

È tempo che i SEO si facciano avanti e si rendano conto che la fuga di Yandex è più di un semplice insieme di fattori di ranking. È un'opportunità per conoscere gli algoritmi dei motori di ricerca dall'interno.

10 cose che impariamo dalla perdita di Yandex Source

In sintesi, ecco dieci cose da imparare dai fattori di ranking trapelati da Yandex:

#1.Matrix Net

MatrixNet è stato annunciato per la prima volta nel 2009. CatBoost lo avrebbe sostituito nel 2007.

Yandex lo menziona nei suoi fattori di ranking.

Tuttavia, ciò convalida ulteriormente l'affermazione secondo cui si tratta di un repository obsoleto.

Originariamente, MatrixNet è stato introdotto come nuovo algoritmo di base per la SERP di Yandex. Ha preso in considerazione migliaia di fattori di ranking, assegnando pesi in base alla query di ricerca, alla posizione dell'utente e all'intento di ricerca percepito.

Lanciato sei anni prima di RankBrain di Google, MatrixNet di Yandex era considerato uno degli algoritmi di ricerca più avanzati.

Altri algoritmi sono stati costruiti su MatrixNet. Nel 2016, Yandex ha lanciato l'algoritmo Palekh che utilizzava reti neurali profonde per generare risultati più accurati, mentre l'algoritmo Pinet si è concentrato sulla riduzione dei risultati falsi positivi.

L'algoritmo Palekh potrebbe elaborare 150 pagine Web alla volta, rendendolo una delle versioni più potenti mai rilasciate. Nel 2017, Yandex ha rilasciato una versione ancora più avanzata chiamata aggiornamento Korolyov, che ha elaborato 200.000 pagine contemporaneamente ed è arrivata persino a considerare la profondità della pagina.

#2.URL e fattori a livello di pagina

Yandex considera molti fattori a livello di URL e pagina durante il posizionamento delle pagine web. Questi includono:

  • La presenza di numeri nell'URL
  • La presenza e il numero di barre finali (le stai usando eccessivamente?)
  • La presenza e il numero di lettere maiuscole nell'URL

Yandex considera anche l'età della pagina e la data dell'ultimo aggiornamento. Sappiamo tutti che Google apprezza i nuovi contenuti e Yandex non è diverso, in particolare per le query di ricerca relative alle notizie.

La fuga di notizie mostra anche che Yandex ha utilizzato i timestamp, non per la classifica ma per il riordino. Non lo usano più, però.

Nella versione obsoleta dell'algoritmo, le parole chiave venivano utilizzate nell'URL. Ovviamente non lo usano più, ma puoi ancora usarlo per avere un'idea di come classificano le pagine.

#3.Profondità di scansione

Google ha dichiarato che la profondità di scansione non è esplicitamente un fattore di ranking. Tuttavia, Yandex ha un pezzo di codice attivo nel suo algoritmo che considera la profondità di scansione di una pagina.

Per profondità di scansione si intende il numero di clic necessari a un utente per accedere a una pagina specifica dalla home page.

Gli URL facilmente raggiungibili dalla home page si posizioneranno più in alto rispetto a quelli che richiedono più clic. Questo perché Yandex ritiene che le pagine più vicine alla home page siano probabilmente più importanti e pertinenti per l'utilizzo.

LEGGI ANCHE Monetizzare Instagram: 15 cose che devi sapere per monetizzare Instagram

Rispecchia l'affermazione di John Muller secondo cui Google dà un po' più di peso alle pagine più vicine alla homepage.

Il codice trapelato ha anche un token specifico per pesare le pagine orfane, cioè le pagine non collegate a nessun'altra pagina del sito web.

#4.Clicca e CTR

Yandex ha scritto un post sul blog nel 2011 discutendo di come utilizzano i clic e le percentuali di clic come fattori di ranking.

Hanno anche parlato di come la SEO potrebbe essere tentata di utilizzare questo fattore di ranking per manipolare le proprie classifiche.

I fattori di clic specifici evidenziati nella fuga di notizie ci danno un'idea di quanto segue:

  • Il rapporto di clic ricevuti dal collegamento rispetto al rapporto di tutti i clic nel risultato di ricerca
  • Come sopra, ma suddivisa per regione
  • Con quale frequenza gli utenti fanno clic sulle pagine dei risultati di ricerca?
  • Dalla fuga di notizie, possiamo vedere che Yandex considera i dati sui clic quando classifica le pagine nel suo motore di ricerca.

Più clic riceve una pagina, più alto è il suo posizionamento. È un fattore di ranking indiretto, ma ha un impatto sulle classifiche.

#5.Fare clic su Manipolazione

La manipolazione dei clic è da anni un argomento di interesse nei circoli SEO. Altrimenti noto come "click-jacking", la pratica prevede di gonfiare artificialmente i clic su un collegamento per aumentarne il posizionamento.

Sembra che Yandex ne sia consapevole e stia attivamente cercando di impedire che accada.

Hanno un filtro (il filtro PF) che esegue attivamente la scansione e identifica i modelli di clic sospetti.

Sembra che se un collegamento ha uno schema innaturale di clic, verrà penalizzato nelle classifiche.

#6.Comportamento dell'utente

La sezione del leak sul comportamento degli utenti è particolarmente interessante.

I SEO senza scrupoli hanno cercato di ingannare il sistema per anni, dall'acquisto di link al riempimento di parole chiave.

Ma Yandex sta reprimendo tutte queste pratiche e sta cercando attivamente di premiare i siti che offrono davvero un'ottima esperienza utente.

Yandex utilizza il filtro PF, lo stesso filtro utilizzato per la manipolazione dei clic, per identificare i siti che tentano deliberatamente di manipolare il comportamento degli utenti.

Esamina il tempo trascorso su una pagina, il numero di pagine visitate e altre metriche per decidere se una pagina fornisce un valore reale.

#7.Tempo di dimora

Il tempo di permanenza è la quantità di tempo che un utente trascorre su una pagina.

In uno dei suoi 102 fattori di ranking, Yandex ha questo tag "TG_USERFEAT_SEARCH_DWELL_TIME".

Fanno inoltre riferimento al dispositivo, alla durata dell'utente e al tempo di permanenza medio.

Hanno deprecato circa 39 di questi fattori, ma il tempo di permanenza rimane un fattore di ranking nel loro algoritmo.

Il termine Dwell Time è stato usato per la prima volta da Bing (nel loro post sul blog del 2011).

Tuttavia, Google ha affermato di non utilizzare il tempo di permanenza o segnali di interazione simili come fattore di ranking.

#8.YMYL

YMYL, o Your Money, Your Life, è un termine utilizzato per descrivere i siti Web contenenti informazioni relative a transazioni di denaro, salute e sicurezza.

La fuga di notizie tocca fattori di classificazione specifici per i siti Web medici, finanziari e legali.

Niente di nuovo: nel 2019, durante la conferenza Yandex Webmaster, hanno annunciato la metrica di qualità della ricerca Proxima.  

Quindi, come dovresti esplorare la perdita di Yandex?

So, How Should you Go About Exploring the Yandex Leak? | MediaOne Marketing Singapore

Pensare ai fattori di ranking di Yandex come base per le ipotesi dei test SEO è il modo migliore per affrontare questa fuga di notizie.

Sebbene non sia possibile isolare i singoli fattori di ranking, in particolare quelli con coefficienti bassi, è possibile comprendere le tendenze generali nel loro algoritmo e provare ad applicarle al proprio sito web.

Certo, non sarà una scienza perfetta, ma almeno avrai qualcosa su cui lavorare quando testerai nuove strategie e tattiche SEO. Prova, misura e regola finché non trovi una formula vincente.

Ad esempio, non esaminiamo mai l'età dei collegamenti durante l'analisi dei profili dei collegamenti, ma Yandex lo fa. Pertanto, ha molto senso per noi iniziare a considerare l'età dei collegamenti e utilizzarla come fattore quando si prendono decisioni sui collegamenti.

Solo perché Yandex ha 17854 fattori di ranking non significa che devi esaminarli tutti. Guarda l'immagine più grande e trova i modelli.

Anche se i motori di ricerca dovessero cambiare e adottare il modello simile a Chat GPT, non ti sarebbe comunque piaciuto sapere qual è stata la formula vincente in tutti questi anni?

Qualche riepilogo

È chiaro che Yandex è andato oltre le tattiche SEO di base e sta sfruttando la sua ricchezza di dati per premiare i siti Web che offrono un'ottima esperienza utente.

La fuga di notizie fa luce sul funzionamento interno dell'algoritmo di Yandex e sembra che i SEO abbiano trascurato alcuni importanti fattori di ranking.