Czy SEO nie doceniają wycieku Yandex?

Opublikowany: 2023-04-01

Wielu specjalistów SEO szybko odrzuciło wyciek kodu źródłowego Yandex. Czy czegoś im brakuje? A może SEO nie doceniają tego, co wyciek może pomóc im dowiedzieć się i zrozumieć o SEO?

Oto mała historia:

Pod koniec stycznia (2023 r.) poinformowano, że pewien haker zdobył około 45 GB kodu źródłowego Yandex, w tym ich współczynniki (wagi) i listę czynników rankingowych.

To odpowiednik poznania algorytmów wyszukiwania Google. Było wokół tego dużo szumu, a duża część społeczności SEO pracowała przez całą dobę, próbując rozszyfrować materiał.

Jednak nie obyło się bez kilku wątpiących Thomasów, którzy szybko odrzucili przeciek argumentami takimi jak:

  • Yandex to nie Google
  • Nie możemy stwierdzić, czy wyciek jest prawdziwy
  • Co to za obsesja na punkcie czynników rankingowych?
  • To tylko kopia. Yandex zeskrobał Google.
  • Wyciek to tylko niewielka część kodu źródłowego Yandex. Nie mówi nic o tym, jak Yandex ocenia strony internetowe.
  • Nie ma tu nic nowego.
  • Repozytorium kodu jest nieaktualne

Czy to krzyk ignorancji, czy też mają rację?

Wyciek może nie być wyczerpujący, ale nadal jest pomocny. Nawet jeśli kod jest przestarzały, pokazuje, jak ewoluowały wyszukiwarki.

Większość z nas nigdy nie spotkała się z lepszym wglądem w działanie nowoczesnych wyszukiwarek. Wiele z tego, co wiemy, to czyste spekulacje.

Nasze zdanie: Reakcja, którą obserwujemy, opiera się głównie na strachu przed nieznanym, pomyłce, mniejszej przestrzeni na interpretację oraz marnowaniu czasu i wysiłku.

Bycie ostrożnym jest w porządku, ale całkowite odrzucenie wycieku oznacza ignorancję.

Nie zostawaj w tyle – zanurz się i eksploruj.

Najczęstsze zastrzeżenia do wycieku kodu źródłowego Yandex

The Most Common Objections to the Yandex Source Code Leak | MediaOne Marketing Singapore

Niektórzy specjaliści od SEO szybko przeoczyli potencjał tego wycieku, mając kilka interesujących zastrzeżeń. Przeanalizujmy te argumenty i zobaczmy, czy się utrzymają.

Zastrzeżenie 1: Yandex to nie Google

Yandex i Google to rzeczywiście dwie bardzo różne wyszukiwarki. Ale porównując ich wyniki wyszukiwania, znajdziesz kilka pokrywających się wyników.

Uruchommy kilka zapytań i porównajmy wyniki. Na przykład wyszukaj „najlepsze karty kredytowe” w Yandex i Google.

Oto pierwsza dziesiątka wyników:

Najlepsze karty kredytowe
Google Yandex
Pozycja 1 Najlepsze karty kredytowe Singapur 2023 | Aplikuj teraz! – MoneySmart Najlepsze karty kredytowe Singapur 2023 | Aplikuj teraz! – Inteligentne pieniądze
Pozycja 2 Najlepsze karty kredytowe w Singapurze 2023 – mistrz wartości 5 najlepszych planów kart kredytowych w Singapurze na wszystkie potrzeby (2021) – Bestinsingapore
Pozycja 3 Najlepsze promocje kart kredytowych w Singapurze (marzec 2023) – Sing Saver Najlepsze karty kredytowe w Singapurze na rok 2023 | Finder Singapur – finder.com
Pozycja 4 Najlepsze karty kredytowe w Singapurze 2023 – Seedly Porównaj najlepsze karty kredytowe w Singapurze [2023] – Finty
Pozycja 5 Najlepsze bonusy za rejestrację karty kredytowej w Singapurze (marzec 2023) – Suite Smile 5 najlepszych kart kredytowych w Singapurze do ogólnych wydatków (2023) – Natychmiastowa pożyczka
Pozycja 6 Porównaj najlepsze karty kredytowe w Singapurze [2023] – Finty Karty kredytowe w Singapurze: Oferty na luty 2023 r. | SingSaver
Pozycja 7 Porównaj karty kredytowe Singapur – DBS Bank 5 NAJLEPSZYCH kart kredytowych w Singapurze w 2021 r. – YouTube
Pozycja 8 Złóż wniosek o kartę kredytową przez Trust | Trust Bank Singapur Najlepsze karty kredytowe do zakupów online i płatności mobilnych — mistrz wartości

Jak widać, połowa wyników jest taka sama.

1/10 wyników utrzymuje tę samą pozycję.

Teraz zróbmy to samo z innymi słowami kluczowymi i zobaczmy, jak się układają:

Słowa kluczowe Liczba podobnych wyników w pierwszej 10 Liczba wyników z tą samą pozycją
Najlepsze karty kredytowe w Singapurze 5/10 1/10
Najlepsze hotele w Nowym Jorku 6/10 0/10
Najlepsze oprogramowanie CRM 2/10 0/10
Jak usunąć gałąź w Git 3/10 1/10
Jak nauczyć szczeniaka nocnika 1/10 1/10
Mieszkanie z 3 sypialniami w Moskwie 5/10 0/10
Typowe objawy przeziębienia 2/10 0/10

Można by się spierać, które wyniki są lepsze, ale nakładanie się mówi nam coś interesującego. To znak, że w obu wyszukiwarkach istnieją podobne czynniki rankingowe i że nie są one całkowicie różne.

Tak więc fakt, że Yandex nie jest Googlem, nie oznacza, że ​​wyciek jest nieistotny.

Zastrzeżenie 2: Nie możemy stwierdzić, czy wyciek jest prawdziwy

Yandex oficjalnie potwierdził przeciek, więc nie ma wątpliwości, że tak się stało ( źródło ).

Ale jeśli w to nie wierzysz, spójrz na repozytorium kodu. Możesz porównać go z innymi projektami i zobaczyć, jak struktura, formatowanie i składnia pasują do tego, czego można oczekiwać od profesjonalnego kodu.

Zastrzeżenie 3: Co to za obsesja na punkcie czynników rankingowych?

Obsesja na punkcie czynników rankingowych jest zrozumiała, gdy weźmie się pod uwagę, ile czasu i pieniędzy przeznacza się na SEO. To naturalne, że chcesz mieć przewagę nad konkurencją.

PRZECZYTAJ TAKŻE Jak uruchomić Akademię Nauki Online?

Znajomość czynników rankingowych może pomóc w lepszej optymalizacji witryny. Daje zrozumienie, jak działają wyszukiwarki i umożliwia odpowiednie dostosowanie treści.

Zastrzeżenie 4: To tylko kopia.Yandex zeskrobał Google

Niektóre z czynników rankingowych odkrytych w wyniku wycieku Yandex pasują do tych używanych przez Google. Ale to nie znaczy, że Yandex skopiował swój algorytm.

uzyskać reklamę rankingową Google

Obie wyszukiwarki stosują różne metody obliczania trafności treści. Yandex ma swoje własne, unikalne podejście, które można zobaczyć w repozytorium kodu.

Yandex mógł wziąć niektóre z najlepszych praktyk od Google, ale w kodzie wciąż jest wiele unikalnych zalet.

Zastrzeżenie 5: Wyciek to tylko niewielka część kodu źródłowego Yandex

To może być prawda, ale wciąż daje nam wgląd w to, jak działa Yandex. Kod źródłowy to duża część układanki; jego zrozumienie może dostarczyć cennych informacji.

Argumentem wysuwanym przez większość SEO jest to, że wyciekło tylko jedno repozytorium i że tak gigantycznej wyszukiwarki nie można sprowadzić do jednego repozytorium kodu.

Cóż, mimo że większość wyszukiwarek Google opiera się na jednym repozytorium, wciąż jest to najpotężniejsza wyszukiwarka na świecie.

źródło

Zarzut 6: Nie ma tu nic nowego

Rzeczywiście, większość czynników rankingowych odkrytych w wyniku wycieku kodu źródłowego Yandex nie jest przełomowa. To rzeczy, które już znaliśmy i o których mówiliśmy od lat.

Ale to nieprawda:

To, co twierdzimy, że już wiemy, było czystymi przypuszczeniami.

O SEO wiemy z własnych doświadczeń, eksperymentów, studiów teoretycznych, anegdot itp.

Do tej pory nigdy nie widzieliśmy tych sygnałów rankingowych w kodzie źródłowym. Po raz pierwszy profesjonaliści mogą potwierdzić te teorie i mieć prawdziwe dowody na ich poparcie.

Najważniejsze cechy SEO kodu źródłowego Yandex

Kilku specjalistów ds. SEO podjęło się zbadania kodu źródłowego i podzielenia się tym, co znaleźli.

Oto niektóre z najważniejszych wydarzeń:

# 1.Lista czynników rankingowych Yandex autorstwa Martina MacDonalda

Martin MacDonald , autor i założyciel Web Marketing School, opracował listę czynników rankingowych Yandex na podstawie wycieku kodu źródłowego.

Odkrył, że istnieje znacznie więcej niż 1922 indywidualnych czynników rankingowych, zaczynając od Page Rank (PR) i przechodząc do elementów opartych na tekście/treści, metatagach, strukturze linków i nie tylko.

Ben Wills przejrzał kod i obliczył rzeczywistą liczbę. Okazuje się, że Yandex ma 17854 czynniki rankingowe.

#2.19% czynników rankingu koncentruje się na sygnałach użytkownika, 6% na trafności treści i 6% na linkach (autor: Malte Landwehr)

Malte Landwehr, szef SEO w Idealo, dokładnie przeanalizował kod źródłowy i wydobył kilka cennych informacji.

Odkrył, że 19% czynników rankingowych Yandex koncentruje się na sygnałach użytkowników (np. współczynnik odrzuceń), 6% na trafności treści (np. gęstość słów kluczowych), a 6% na linkach (np. jakość linków przychodzących).

Odkrycia Malte wydają się potwierdzać to, co zgłosił SEMrush, kiedy opublikowali swoje badanie czynnika rankingowego, które wykazało, że ruch na stronie internetowej miał najwyższy współczynnik rankingu. Społeczność SEO szybko ich skrytykowała, ale ustalenia Malte zgadzają się z ich twierdzeniem.

#3.W Kodeksie było około 40 czynników rankingowych związanych z jakością (Malte Landwehr)

Ze swojej analizy Malte Landwehr dowiedział się również, że kod ma około 40 czynników rankingowych związanych z jakością.

Te czynniki rankingowe zostały podzielone na trzy:

  • Gospodarz
  • Strona
  • Tekst

Witryna/Host/Jakość

Yandex zwraca uwagę na szczegóły witryny. Sprawdzają średnią świeżość treści, średnią jakość tekstu i historyczną skuteczność Twoich treści (ponad 10 czynników). Następnie przystępują do kategoryzowania witryny hostingowej jako niskiej, akceptowalnej, dobrej lub doskonałej jakości.

Ich reguły YMYL są specyficzne dla hosta, a nie dla dokumentu. Innymi słowy, Yandex patrzy na zawartość Twojej witryny całościowo, a nie na zasadzie strona po stronie.

Jakość strony

Yandex zwraca również uwagę na jakość samej strony.

Przyjrzą się kodowi stanu 404 osadzonej lub połączonej treści. Oznaczają Twoją stronę jako niskiej jakości, jeśli treść nie zostanie znaleziona.

Uszkodzone pliki wideo są najgorsze; Yandex oznaczy twoją stronę jako niskiej jakości, jeśli zostanie wykryta.

Jakość tekstu

Yandex patrzy również na tekst na stronie.

Najpierw przyjrzą się naturalnemu występowaniu czasowników, zaimków, przymiotników, rzeczowników, przysłówków i innych części mowy.

Wykorzystują również różne metody wykrywania treści generowanych automatycznie i treści będących plagiatami.

Czynniki rankingu są specyficzne dla zapytania

Od dawna argumentowano, że czynniki rankingowe są coraz bardziej specyficzne dla kategorii.

Tak było w przypadku Google i innych wyszukiwarek, ale Yandex idzie dalej.

Nie tylko patrzą na kategorię lub słowo kluczowe, ale także na samo zapytanie.

PRZECZYTAJ TAKŻE Najlepsze aplikacje do zakupów online w Singapurze

Ich kod źródłowy zawiera statyczne, binarne i specyficzne dla zapytania czynniki rankingowe.

Czynniki statyczne dotyczą witryny, czynniki dynamiczne dotyczą zapytania, a czynniki użytkownika są powiązane z językiem użytkownika, historią wyszukiwania, lokalizacją i innymi danymi.

Czynniki rankingowe 17854

Martin MacDonald, Ben Wills i Malte Landwehr zgadzają się, że Yandex ma imponujące czynniki rankingowe.

Łącznie obliczyli, że istnieje 17854 indywidualnych czynników rankingowych.

Te czynniki rankingowe są zbudowane wokół różnych modalności. Jednak z tego tylko 1922 nie jest przestarzały.

W ten sam sposób, w jaki ludzie źle rozumieją wpływ procentu składanego, niezwykle trudno jest oszacować wynik tych algorytmów. Dodaj gradientowe i binarne, specyficzne dla zapytania i użytkownika czynniki rankingowe do miksu, a otrzymasz algorytmiczny koszmar.

Inżynieria wsteczna staje się prawie niemożliwa. Fakt, że istnieje tak wiele ruchomych części, nie zapominając o ekosystemie internetowym, sprawia, że ​​algorytm Yandex jest ogromną zagadką. Jest to również zachęcające, ponieważ pokazuje, że giganci wyszukiwarek rozważają różne aspekty strony internetowej, aby określić jej ranking, zamiast skupiać się tylko na jednym lub dwóch aspektach.

Wygląda na to, że Yandex stosuje podobne najlepsze praktyki wyszukiwania informacji jak Google

Chociaż ich algorytm jest niezwykle złożony i trudny do inżynierii wstecznej, istnieją podobieństwa z najlepszymi praktykami Google, takimi jak odwrócony indeks lub osadzanie.

Yandex wykorzystuje również różne modele, takie jak sieć neuronowa MatrixNet, do określenia ich współczynników rang. Pamiętaj, że MatrixNet był wtedy czymś, zanim CatBoost zastąpił go w 2007 roku.

Wiedza o tym, jak i gdzie MatrixNet jest używany w ich algorytmie, da ci wyobrażenie o tym, jak wiele nowoczesnych wyszukiwarek poświęca na dostosowywanie i dostrajanie swoich modeli rankingowych.

Czy więc SEO nie doceniają wycieku Yandex?

Aby zrozumieć prawdziwe implikacje algorytmicznego wycieku Yandex, specjaliści SEO muszą zacząć myśleć jak badacze.

Wyobraź sobie, że naukowcy mieli kompletną sekwencję DNA raka u myszy. Używając tego samego rozumowania, którego używają SEO, aby odrzucić wyciek Yandex, czy argumentowaliby, że myszy nie są ludźmi, a sekwencje DNA są bezużyteczne?

Oczywiście nie.

Nadszedł czas, aby SEO przyspieszyli i zdali sobie sprawę, że wyciek Yandex to coś więcej niż tylko zestaw czynników rankingowych. To okazja, aby poznać algorytmy wyszukiwarek od podszewki.

10 rzeczy, których dowiadujemy się z wycieku źródła Yandex

Podsumowując, oto dziesięć rzeczy, których można się nauczyć z czynników rankingowych Yandex, które wyciekły:

# 1.MatrixNet

MatrixNet został po raz pierwszy ogłoszony w 2009 roku. CatBoost zastąpi go w 2007 roku.

Yandex wspomina o tym w swoich czynnikach rankingowych.

Jednak to dodatkowo potwierdza twierdzenie, że jest to przestarzałe repozytorium.

Pierwotnie MatrixNet został wprowadzony jako nowy podstawowy algorytm dla SERP Yandex. Wzięto pod uwagę tysiące czynników rankingowych, przypisując wagi na podstawie zapytania wyszukiwania, lokalizacji użytkownika i postrzeganej intencji wyszukiwania.

Uruchomiony sześć lat przed RankBrain firmy Google, MatrixNet firmy Yandex był uważany za jeden z najbardziej zaawansowanych algorytmów wyszukiwania.

Inne algorytmy zostały zbudowane na MatrixNet. W 2016 roku Yandex uruchomił algorytm Palekh, który wykorzystywał głębokie sieci neuronowe do generowania dokładniejszych wyników, podczas gdy algorytm Pinet skupiał się na ograniczaniu wyników fałszywie dodatnich.

Algorytm Palekh mógł przetwarzać jednocześnie 150 stron internetowych, co czyni go jedną z najpotężniejszych wersji, jakie kiedykolwiek wydano. W 2017 roku Yandex wydał jeszcze bardziej zaawansowaną wersję o nazwie Korolyov update, która przetwarzała jednocześnie 200 000 stron, a nawet uwzględniała głębokość strony.

#2.Czynniki na poziomie adresu URL i strony

Yandex bierze pod uwagę wiele czynników na poziomie adresu URL i strony podczas ustalania rankingu stron internetowych. Obejmują one:

  • Obecność liczb w adresie URL
  • Obecność i liczba końcowych ukośników (czy używasz ich nadmiernie?)
  • Obecność i liczba wielkich liter w adresie URL

Yandex bierze również pod uwagę wiek strony i datę ostatniej aktualizacji. Wszyscy wiemy, że Google ceni sobie świeże treści, a Yandex nie różni się od nich, szczególnie w przypadku zapytań związanych z wiadomościami.

Wyciek pokazuje również, że Yandex używał znaczników czasu nie do rankingu, ale do zmiany kolejności. Już go jednak nie używają.

W wycofanej wersji algorytmu w adresie URL zastosowano słowa kluczowe. Oczywiście już go nie używają, ale nadal możesz go używać, aby dowiedzieć się, jak oceniają strony.

#3.Głębokość indeksowania

Google twierdzi, że głębokość indeksowania nie jest wyraźnie czynnikiem rankingowym. Jednak Yandex ma aktywny fragment kodu w swoim algorytmie, który uwzględnia głębokość indeksowania strony.

Przez głębokość indeksowania rozumiemy liczbę kliknięć potrzebnych użytkownikowi, aby przejść do określonej strony ze strony głównej.

Adresy URL, które są łatwo dostępne ze strony głównej, będą miały wyższą pozycję w rankingu niż te, które wymagają większej liczby kliknięć. Dzieje się tak, ponieważ Yandex uważa, że ​​strony znajdujące się bliżej strony głównej będą prawdopodobnie ważniejsze i bardziej przydatne w użytkowaniu.

PRZECZYTAJ TAKŻE Zarabianie na Instagramie: 15 rzeczy, które musisz wiedzieć, aby zarabiać na Instagramie

Odzwierciedla stwierdzenie Johna Mullera, że ​​Google przywiązuje nieco większą wagę do stron znajdujących się bliżej strony głównej.

Kod, który wyciekł, posiada również specjalny token do ważenia stron osieroconych, tj. stron niepowiązanych z żadną inną stroną w serwisie.

#4.Kliknij i CTR

Yandex napisał post na blogu w 2011 roku, w którym omówił, w jaki sposób wykorzystują kliknięcia i współczynniki klikalności jako czynniki rankingowe.

Rozmawiali również o tym, jak SEO może ulec pokusie wykorzystania tego czynnika rankingowego do manipulowania swoimi rankingami.

Konkretne czynniki kliknięcia wyróżnione w wycieku dają nam wgląd w następujące kwestie:

  • Stosunek kliknięć linku do stosunku wszystkich kliknięć w wyniku wyszukiwania
  • To samo co powyżej, ale w podziale na regiony
  • Jak często użytkownicy klikają strony z wyników wyszukiwania?
  • Z wycieku widać, że Yandex bierze pod uwagę dane o kliknięciach podczas rankingu stron w swojej wyszukiwarce.

Im więcej kliknięć otrzymuje strona, tym wyższa jest jej pozycja w rankingu. Jest to pośredni czynnik rankingowy, ale ma wpływ na rankingi.

#5.Kliknij Manipulacja

Manipulacja kliknięciami od lat jest przedmiotem zainteresowania kręgów SEO. Praktyka ta, znana również jako „click-jacking”, polega na sztucznym zawyżaniu liczby kliknięć linku w celu podniesienia jego pozycji w rankingu.

Wygląda na to, że Yandex jest tego świadomy i aktywnie stara się temu zapobiec.

Mają filtr (Filtr PF), który aktywnie skanuje i identyfikuje podejrzane wzorce kliknięć.

Wygląda na to, że jeśli link ma nienaturalny schemat kliknięć, zostanie ukarany w rankingach.

#6.Zachowanie użytkownika

Szczególnie interesująca jest sekcja zachowania użytkowników wycieku.

Pozbawieni skrupułów SEO od lat próbują oszukać system, od kupowania linków po upychanie słów kluczowych.

Ale Yandex rozprawia się z tymi wszystkimi praktykami i aktywnie stara się nagradzać witryny, które naprawdę zapewniają doskonałe wrażenia użytkownika.

Yandex używa PF Filter, tego samego filtra, którego używa do manipulacji kliknięciami, do identyfikowania stron celowo próbujących manipulować zachowaniem użytkowników.

Sprawdza czas spędzony na stronie, liczbę odwiedzonych stron i inne dane, aby zdecydować, czy strona zapewnia rzeczywistą wartość.

#7.Czas oczekiwania

Czas przebywania to czas, jaki użytkownik spędza na stronie.

W jednym ze 102 czynników rankingowych Yandex ma ten tag „TG_USERFEAT_SEARCH_DWELL_TIME”.

Odwołują się również do urządzenia, czasu trwania użytkownika i średniego czasu przebywania.

Odrzucili około 39 z tych czynników, ale czas przebywania pozostaje czynnikiem rankingowym w ich algorytmie.

Termin Dwell Time został po raz pierwszy użyty przez Bing (w ich poście na blogu z 2011 roku).

Jednak Google powiedział, że nie używa czasu przebywania ani podobnych sygnałów interakcji jako czynnika rankingowego.

#8.YMYL

YMYL, czyli Your Money, Your Life, to termin używany do opisania stron internetowych zawierających informacje związane z transakcjami związanymi z pieniędzmi, zdrowiem i bezpieczeństwem.

Wyciek dotyczy określonych czynników rankingowych dla stron medycznych, finansowych i prawnych.

Nic nowego — w 2019 roku podczas konferencji Yandex Webmaster ogłosili wskaźnik jakości wyszukiwania Proxima.  

Jak więc powinieneś zbadać wyciek Yandex?

So, How Should you Go About Exploring the Yandex Leak? | MediaOne Marketing Singapore

Myślenie o czynnikach rankingowych Yandex jako podstawie hipotez testów SEO to najlepszy sposób na rozwiązanie tego wycieku.

Chociaż nie możesz wyizolować poszczególnych czynników rankingowych, zwłaszcza tych o niskich współczynnikach, możesz zrozumieć ogólne trendy w ich algorytmie i spróbować zastosować je we własnej witrynie.

Jasne, nie będzie to doskonała nauka, ale przynajmniej będziesz miał z czym pracować podczas testowania nowych strategii i taktyk SEO. Testuj, mierz i dostosowuj, aż znajdziesz zwycięską formułę.

Na przykład nigdy nie patrzymy na wiek linków podczas analizy profili linków, ale Yandex tak. Dlatego bardzo sensowne jest, abyśmy zaczęli przyglądać się wiekowi linków i wykorzystywać go jako czynnik przy podejmowaniu decyzji dotyczących linków.

To, że Yandex ma 17854 czynniki rankingowe, nie oznacza, że ​​musisz je wszystkie przejrzeć. Spójrz na większy obraz i znajdź wzory.

Nawet gdyby wyszukiwarki zmieniły się i przyjęły model podobny do czatu GPT, czy nadal nie chciałbyś wiedzieć, jaka była zwycięska formuła przez te wszystkie lata?

Jakieś podsumowanie

Oczywiste jest, że Yandex wyszedł poza podstawowe taktyki SEO i wykorzystuje swoje bogactwo danych, aby nagradzać witryny oferujące doskonałe wrażenia użytkownika.

Wyciek rzuca nieco światła na wewnętrzne działanie algorytmu Yandex i wydaje się, że SEO mogło przeoczyć niektóre ważne czynniki rankingowe.