SEO は Yandex のリークを過小評価していますか?

公開: 2023-04-01

多くの SEO 担当者は、Yandex のソース コード リークをすぐに片付けました。 彼らに欠けているものはありますか? それとも、SEO について学び、理解するためにリークが役立つことを SEO が過小評価しているのでしょうか?

ここに少し裏話があります:

1 月末 (2023 年) に向けて、一部のハッカーが約 45 GB の Yandex ソース コード (係数 (重み) とランキング要素のリストを含む) を手に入れたと報告されました。

これは、Google の検索アルゴリズムを見つけることに相当します。 その周りには多くの誇大宣伝があり、SEO コミュニティの大部分は 24 時間体制で資料を解読しようと取り組んできました。

しかし、トーマスを疑う人が少なからずいたわけではなく、次のような議論でリークをすぐに却下しました。

  • Yandex は Google ではありません
  • リークが本物かどうかを確認することはできません
  • ランキング要素への執着は何ですか?
  • それはただのコピーです。 Yandex は Google をスクレイピングしました。
  • リークは、Yandex のソース コードのほんの一部です。 Yandex が Web サイトをランク付けする方法については何も述べていません。
  • ここには新しいものは何もありません。
  • コードリポジトリが古くなっています

これは無知を叫びますか、それとも正しいですか?

リークは包括的ではないかもしれませんが、それでも役に立ちます。 コードが古くても、検索エンジンがどのように進化したかがわかります。

私たちのほとんどは、最新の検索エンジンがどのように機能するかについて、これほど優れた洞察に遭遇したことはありません。 私たちが知っていることの多くは、純粋な憶測です。

私たちの見解: 私たちが目にする反応は、ほとんどが未知のものへの恐怖、間違っている、解釈の余地が少ない、時間と労力の浪費に基づいています。

慎重であることは問題ありませんが、リークをあからさまに無視することは、無知を叫ぶことになります。

置き去りにしないでください。飛び込んで探索しましょう。

Yandex のソース コード リークに対する最も一般的な反論

The Most Common Objections to the Yandex Source Code Leak | MediaOne Marketing Singapore

一部の SEO 担当者は、このリークの可能性をすぐに見落としており、興味深い反論がいくつかあります。 これらの議論を調べて、それらが成り立つかどうか見てみましょう。

反論 1: Yandex は Google ではない

Yandex と Google は、まったく異なる 2 つの検索エンジンです。 しかし、検索結果を比較すると、いくつかの重複が見つかります。

いくつかの検索クエリを実行して、結果を比較してみましょう。 たとえば、Yandex と Google で「最高のクレジット カード」を検索します。

上位 10 件の結果は次のとおりです。

最高のクレジットカード
グーグルヤンデックス
ポジション 1 ベスト クレジット カード シンガポール 2023 | 今すぐ申し込んでください! – マネースマートベスト クレジット カード シンガポール 2023 | 今すぐ申し込んでください! – マネースマート
ポジション 2 2023 年シンガポールのベスト クレジット カード – バリュー チャンピオンあらゆるニーズに対応するシンガポールの 5 つのベスト クレジット カード プラン (2021 年) – Bestinsingapore
ポジション 3 シンガポールのベスト クレジット カード プロモーション (2023 年 3 月) – Sing Saver 2023 年のシンガポールで最高のクレジット カード | Finder シンガポール – finder.com
ポジション 4 2023年シンガポールで最高のクレジットカード – Seedly シンガポールで最高のクレジットカードを比較 [2023] – Finty
ポジション 5 シンガポールで最高のクレジット カード サインアップ ボーナス (2023 年 3 月) – Suite Smile 全体的な支出に適したシンガポールの 5 つのベスト クレジット カード (2023) – インスタント ローン
ポジション 6 シンガポールで最高のクレジットカードを比較 [2023] – Finty シンガポールのクレジット カード: 2023 年 2 月のお得な情報 | シングセイバー
ポジション 7 クレジットカードの比較 シンガポール – DBS Bank 2021 年シンガポールのベスト 5 クレジット カード – YouTube
位置 8 Trust によるクレジット カードの申し込み | トラストバンクシンガポールオンライン ショッピングとモバイル決済に最適なクレジット カード – バリュー チャンピオン

ご覧のとおり、結果の半分は同じです。

結果の 1/10 が同じ位置を保持します。

次に、他のキーワードについても同じことを行い、それらがどのように積み重なっていくかを見てみましょう。

キーワードトップ 10 内の同様の結果の数同じ位置の結果の数
シンガポールで最高のクレジットカード5/10 1/10
ニューヨークで最高のホテル6/10 0/10
最高の CRM ソフトウェア2/10 0/10
Git でブランチを削除する方法3/10 1/10
子犬のトイレトレーニング方法1/10 1/10
モスクワにあるアパートメント、ベッドルーム 3 室5/10 0/10
一般的な風邪の症状2/10 0/10

どちらの結果が優れているかについて議論することもできますが、重複から興味深いことがわかります。 これは、両方の検索エンジンに同様のランキング要因が存在し、完全に異なるわけではないことを示しています。

したがって、Yandex が Google ではないという事実は、リークが無関係であることを意味しません。

反論 2: リークが本物かどうか確認できない

Yandex が正式にリークを確認したので、間違いなく発生しました ( source )。

しかし、それが信じられない場合は、コードのリポジトリを見てください。 他のプロジェクトと比較して、構造、フォーマット、および構文がプロのコードに期待するものとどのように一致しているかを確認できます。

反対意見 3: ランキング要素にこだわる理由は何ですか?

SEOにどれだけの時間とお金が費やされているかを考えると、ランキング要因への執着は理解できます. 競争相手より優位に立ちたいと思うのは自然なことです。

また読むオンライン学習アカデミーを立ち上げる方法?

ランキング要因を知ることは、Web サイトをより適切に最適化するのに役立ちます。 検索エンジンがどのように機能するかを理解し、それに応じてコンテンツを調整できるようにします。

反論 4: それはただのコピーです。Yandex スクレイピング Google

Yandex のリークから発見されたランキング要素の一部は、Google が使用しているものと一致しています。 しかし、それは Yandex がアルゴリズムをコピーしたという意味ではありません。

Google ランキング広告を取得する

2 つの検索エンジンは、異なる方法を使用してコンテンツの関連性を計算します。 Yandex には独自のアプローチがあり、コード リポジトリで確認できます。

Yandex は Google からいくつかのベスト プラクティスを取り入れた可能性がありますが、コードにはまだ多くの独自のセールス ポイントがあります。

反対意見 5: リークは Yandex のソース コードのごく一部にすぎない

それは本当かもしれませんが、Yandex がどのように機能するかについての洞察を与えてくれます。 ソース コードはパズルの大きな部分を占めています。 それを理解することで、貴重な情報を得ることができます。

ほとんどの SEO は、リークされたのは 1 つのリポジトリだけであり、このような巨大な検索エンジンは 1 つのコード リポジトリに要約できないという主張です。

Google の検索エンジンのほとんどは単一のリポジトリに基づいていますが、依然として世界で最も強力な検索エンジンです。

ソース

反対意見 6: 新しいものは何もない

実際、Yandex のソース コード リークから明らかになったランキング要因のほとんどは、画期的なものではありません。 それらは私たちがすでに知っていて、何年も話し合ってきたことです。

しかし、それは真実ではありません:

私たちがすでに知っていると主張することは、純粋に推測にすぎません。

私たちは経験、実験、理論的研究、逸話などから SEO について知っています。

これまで、ソース コードでこれらのランキング シグナルを確認したことはありません。 専門家がこれらの理論を確認し、それらを裏付ける実際の証拠を得ることができたのはこれが初めてです.

Yandex ソースコードの SEO ハイライト

一部の SEO 担当者は、ソース コードを調査し、発見した内容を分析することに取り組みました。

ここにいくつかのハイライトがあります:

#1。Martin MacDonaldによるYandexランキング要因のリスト

Web Marketing School の著者であり創設者であるMartin MacDonald 氏は、ソース コード リークから Yandex ランキング要因のリストをまとめました。

彼は、ページ ランク (PR) から始まり、テキスト/コンテンツ ベースの要素、メタ タグ、リンク構造などに至るまで、1922 をはるかに超える個々のランキング要素があることを発見しました。

Ben Wills はコードを調べて、実際の数を計算しました。 Yandex には 17854 のランキング要素があることがわかりました

#2。ランキング要因の 19% はユーザー シグナルに、6% はコンテンツの関連性に、6% はリンクに焦点を当てています (Malte Landwehr による)

Idealo の SEO 責任者である Malte Landwehr は、ソース コードを徹底的に分析し、いくつかの貴重な情報を抽出しました。

彼は、Yandex のランキング要因の 19% がユーザー シグナル(直帰率など)、6% がコンテンツの関連性 (キーワード密度など)、6% がリンク (インバウンドリンクの品質など) に焦点を当てていることを発見しました

Malte の調査結果は、Web サイトへのトラフィックが最も高いランキング係数を持つことを示したランキング係数調査を公開した際に SEMrush が報告した内容を裏付けているようです。 SEO コミュニティはすぐに彼らを非難しましたが、Malte の調査結果は彼らの主張と一致しています。

#3。コードには約 40 の品質関連のランキング要素がありました (Malte Landwehr)

彼の分析から、Malte Landwehr は、コードに約 40 の品質関連のランキング要因があることも発見しました。

これらのランキング要因は、次の 3 つに分けられます。

  • ホスト
  • ページ
  • 文章

サイト/ホスト/品質

Yandex はサイトの詳細に注意を払っています。 平均的なコンテンツの鮮度、平均的なテキストの品質、およびコンテンツの過去のパフォーマンス (10 以上の要素) を調べます。 次に、ホスティング サイトを低い、許容できる、良い、または優れた品質に分類します。

YMYL ルールはホスト固有であり、ドキュメント固有ではありません。 つまり、Yandex は Web サイトのコンテンツをページごとではなく全体的に調べます。

ページの品質

Yandex は、ページ自体の品質にも注目しています。

彼らは、埋め込まれたコンテンツまたはリンクされたコンテンツの 404 ステータス コードを調べます。 コンテンツが見つからない場合、ページは低品質としてマークされます。

壊れたビデオ ファイルは最悪です。 Yandex は、ページが検出された場合、ページを低品質としてマークします。

テキスト品質

Yandex は、ページ上のテキストも調べます。

まず、動詞、代名詞、形容詞、名詞、副詞、その他の品詞の自然発生を調べます。

また、さまざまな方法を使用して、自動生成されたコンテンツや盗用されたコンテンツを検出します。

ランキング要因はクエリ固有です

ランキング要因はますますカテゴリ固有のものになっていると長い間主張されてきました。

これは Google や他の検索エンジンにも当てはまりますが、Yandex はそれをさらに進めています。

カテゴリやキーワードだけでなく、クエリ自体も確認します。

また読むシンガポールのトップオンラインショッピングアプリ

それらのソース コードには、静的、バイナリ、およびクエリ固有のランキング要素が含まれています。

静的要因は Web サイトに適用され、動的要因はクエリに適用され、ユーザー要因はユーザーの言語、検索履歴、場所、およびその他のデータに関連付けられます。

17854 ランキング要因

Martin MacDonald、Ben Wills、Malte Landwehr はいずれも、Yandex が印象的なランキング要素を持っていることに同意しています。

組み合わせて、彼らは17854の個々のランキング要因があると計算しました.

これらのランキング要因は、さまざまなモダリティに基づいて構築されています。 ただし、このことから、1922年だけは廃止されていません。

人間が複利の影響を理解するのが苦手なのと同じように、これらのアルゴリズムの結果を推定するのは非常に困難です。 グラデーションとバイナリ、クエリ固有、およびユーザー固有のランキング要素をミックスに追加すると、アルゴリズムの悪夢が発生します。

リバースエンジニアリングはほぼ不可能になります。 Webエコシステムを忘れないように、非常に多くの可動部分があるという事実は、Yandexのアルゴリズムを大きな難問にしています. また、検索エンジンの巨人がウェブサイトのランキングを決定するために、1 つまたは 2 つの側面だけに注目するのではなく、さまざまな側面を考慮していることを示しているため、これは励みにもなります。

Yandex は、Google と同様の情報検索のベスト プラクティスに従っているようです

彼らのアルゴリズムは信じられないほど複雑で、リバース エンジニアリングが困難ですが、逆インデックスや埋め込みなど、Google のベスト プラクティスとの類似点があります。

Yandex は、ニューラル ネットワーク MatrixNet などのさまざまなモデルも使用して、ランク係数を決定します。 MatrixNet は、CatBoost が 2007 年に置き換える前の当時のものだったことを思い出してください。

MatrixNet がアルゴリズムのどこでどのように使用されているかを知ることで、最新の検索エンジンがランキング モデルの調整と微調整にどの程度取り組んでいるかがわかります。

では、SEO は Yandex のリークを過小評価しているのでしょうか?

Yandex のアルゴリズム リークの真の意味を理解するには、SEO は研究者のように考え始める必要があります。

研究者がマウスの癌の完全な DNA 配列を持っていたらと想像してみてください。 Yandex のリークを却下するために SEO が使用するのと同じ理由を使用して、彼らはマウスは人間ではなく、DNA シーケンスは役に立たないと主張しますか?

もちろん違います。

SEO 担当者は、Yandex のリークが単なるランキング要因以上のものであることを認識し、強化する時が来ました。 検索エンジンのアルゴリズムを徹底的に学ぶチャンスです。

Yandex のソース リークから学んだ 10 のこと

要約すると、Yandex のリークされたランキング要因から学ぶべき 10 のことを以下に示します。

#1。マトリックスネット

MatrixNet は 2009 年に初めて発表されました。2007 年には CatBoost がそれに取って代わりました。

Yandex は、ランキング要因でそれについて言及しています。

ただし、これは、これが古いリポジトリであるという主張をさらに検証します。

もともと、MatrixNet は Yandex の SERP の新しいコア アルゴリズムとして導入されました。 何千ものランキング要因を考慮し、検索クエリ、ユーザーの場所、認識された検索意図に基づいて重みを割り当てました。

Yandex の MatrixNet は、Google の RankBrain より 6 年前に開始され、最も高度な検索アルゴリズムの 1 つと見なされていました。

その他のアルゴリズムは、MatrixNet に基づいて構築されています。 2016 年、Yandex はディープ ニューラル ネットワークを使用してより正確な結果を生成する Palekh アルゴリズムを開始しましたが、Pinet アルゴリズムは偽陽性の結果を減らすことに重点を置いていました。

パレフ アルゴリズムは一度に 150 の Web ページを処理でき、これまでにリリースされた中で最も強力なバージョンの 1 つになりました。 2017 年、Yandex はコロリョフ アップデートと呼ばれるさらに高度なバージョンをリリースしました。これは、一度に 200,000 ページを処理し、ページの深さまで考慮したものでした。

#2。URL とページレベルの要素

Yandex は、Web ページをランク付けする際に、多くの URL およびページ レベルの要因を考慮します。 これらには以下が含まれます:

  • URL 内の数字の存在
  • 末尾のスラッシュの有無と数 (使いすぎていませんか?)
  • URL の大文字の有無と数

Yandex は、ページの経過時間と最終更新日も考慮します。 Google が新鮮なコンテンツを重視していることは誰もが知っていますが、Yandex も例外ではありません。特にニュース関連の検索クエリではそうです。

このリークは、Yandex がランキングではなく並べ替えのためにタイムスタンプを使用していたことも示しています。 しかし、彼らはもうそれを使用しません。

アルゴリズムの非推奨バージョンでは、キーワードが URL で使用されていました。 もちろん、彼らはもはやそれを使用していませんが、ページのランク付け方法を把握するために引き続き使用できます.

#3。クロール深度

Google は、クロールの深さは明示的にランキング要因ではないと言っている記録があります。 ただし、Yandex のアルゴリズムには、ページのクロール深度を考慮するアクティブなコードが含まれています。

クロール深度とは、ユーザーがホームページから特定のページに到達するまでに必要なクリック数を意味します。

ホームページから簡単にアクセスできる URL は、より多くのクリックを必要とする URL よりも上位にランクされます。 これは、Yandex が、ホームページに近いページほど重要であり、使用に関連している可能性が高いと考えているためです。

また読むInstagramの収益化:Instagramの収益化のために知っておくべき15のこと

これは、Google はホームページに近いページを重視するという John Muller の声明を反映しています。

リークされたコードには、孤立したページ (つまり、Web サイトの他のページにリンクされていないページ) を重み付けするための特定のトークンも含まれています。

#4。クリックと CTR

Yandex は 2011 年に、クリック数とクリックスルー率をランキング要因としてどのように使用しているかを説明するブログ記事を書きました。

彼らはまた、SEO がこのランキング要因を使用してランキングを操作する誘惑に駆られる可能性があることについても話しました。

リークで強調されている特定のクリック要因から、次のことがわかります。

  • 検索結果の全クリック数に対するリンクのクリック数の比率
  • 上記と同じですが、地域別に分類されています
  • ユーザーが検索結果からページをクリックする頻度は?
  • リークから、Yandex が検索エンジンでページをランク付けする際にクリック データを考慮していることがわかります。

ページのクリック数が多いほど、ランクが高くなります。 これは間接的なランキング要因ですが、ランキングに影響を与えます。

#5。クリック操作

クリック操作は、長年にわたって SEO サークルの関心を集めてきたトピックです。 「クリックジャッキング」とも呼ばれるこの行為には、リンクのクリック数を人為的に増やしてランキングを上げることが含まれます。

Yandex はこれを認識しており、積極的に防止しようとしているようです。

疑わしいクリック パターンをアクティブにスキャンして識別するフィルター (PF フィルター) があります。

不自然なパターンのクリックがあったリンクは、ランキングで不利になるようです。

#6。ユーザーの行動

リークのユーザー行動セクションは特に興味深いものです。

悪意のある SEO は、リンクの購入からキーワードの詰め込みまで、何年にもわたってシステムを操作しようとしてきました。

しかし、Yandex はこれらすべての慣行を取り締まり、真に優れたユーザー エクスペリエンスを提供するサイトに積極的に報酬を与えようとしています。

Yandex は、クリック操作に使用するのと同じフィルターである PF フィルターを使用して、意図的にユーザーの行動を操作しようとしているサイトを識別します。

ページに費やされた時間、訪問されたページの数、およびその他の指標を調べて、ページが実際の価値を提供しているかどうかを判断します。

#7。滞留時間

滞留時間は、ユーザーがページに費やす時間です。

102 のランキング要素の 1 つで、Yandex には「TG_USERFEAT_SEARCH_DWELL_TIME」というタグがあります。

また、デバイス、ユーザー期間、平均滞在時間も参照します。

彼らはこれらの要因のうち約 39 を非推奨にしましたが、滞留時間はアルゴリズムのランキング要因のままです。

滞留時間という用語は、Bing によって (2011 年のブログ投稿で) 最初に使用されました。

ただし、Google は、滞在時間や同様のインタラクション シグナルをランキング要素として使用していないと述べています。

#8。YMYL

YMYL (Your Money, Your Life) は、お金、健康、および安全の取引に関連する情報を含む Web サイトを表すために使用される用語です。

リークは、医療、金融、および法律の Web サイトの特定のランキング要因に触れています。

2019 年に開催された Yandex Webmaster カンファレンスで、彼らは Proxima Search Quality Metric を発表しました。  

では、Yandex リークを調査するにはどうすればよいでしょうか?

So, How Should you Go About Exploring the Yandex Leak? | MediaOne Marketing Singapore

Yandex のランキング要因を SEO テストの仮説の基礎として考えることが、このリークに対処する最善の方法です。

個々のランキング要因、特に係数が低い要因を分離することはできませんが、アルゴリズムの全体的な傾向を理解し、自分の Web サイトに適用することはできます。

確かに、これは完璧な科学ではありませんが、少なくとも、新しい SEO 戦略や戦術をテストする際に役立つ情報が得られるでしょう。 成功する公式が見つかるまで、テスト、測定、および調整を行います。

たとえば、リンク プロファイルを分析する際、リンクの経過時間は確認しませんが、Yandex は確認します。 したがって、リンクの経過時間に注目し、リンクに関する決定を下す際の要因として使用することは、非常に理にかなっています。

Yandex に 17854 のランキング要素があるからといって、それらすべてを調べなければならないわけではありません。 全体像を見て、パターンを見つけます。

検索エンジンが変更され、Chat GPT のようなモデルが採用されたとしても、ここ数年の勝利の方程式が何であるかを知りたいと思いませんか?

いくつかのまとめ

Yandex が基本的なありきたりの SEO 戦術を超えて、豊富なデータを活用して優れたユーザー エクスペリエンスを提供する Web サイトに報酬を与えていることは明らかです。

このリークは、Yandex のアルゴリズムの内部動作に光を当てており、SEO はいくつかの重要なランキング要素を見落としている可能性があります。