YandexのリークがSEOゲームプランを永遠に変える方法
公開: 2023-01-31最近、Yandex のソース コードの一部が流出しました。
それはあなたのSEOが前進する上で何を意味するのでしょうか?
これについて考える…
それらのソース コードを理解すると、検索エンジンの内部の仕組みを垣間見ることができます。 これにより、Yandex ランキング要因を分析し、Google が使用するものと比較することができます。
Google は複雑で豊富なデータで知られていますが、Yandex が特定の地域、特にロシアで依然として大きな市場シェアを保持していることは注目に値します。 Yandex のソース コードのリークは、SEO コミュニティが Yandex がどのようにページをスコア付けしてランク付けするかを理解するための貴重な機会です。
この投稿では、私たちが見ている高レベルのテーマのいくつかを分析し、SEO の進め方を変える可能性のあるアルゴリズムのいくつかのユニークな要素を紹介します.
しかし、最初に、Yandex アルゴリズムの分析が非常に重要な理由を調べてみましょう。
Yandex を検討する理由
Yandex のリークにより、主要な検索エンジンの実際のソース コードを確認できる初めての機会が得られました。 ご存知のように、Google は検索エンジンの詳細を明らかにしない一般的なアドバイスを常に提供してきました。
これは、検索結果でコンテンツをより見やすくする方法を理解するために、常にユーザー テストに依存してきたことを意味します。
今回初めて、Web ページの関連性と権威を判断するために使用されるランキング要素の詳細など、Yandex の検索アルゴリズムの内部動作の一部を確認できます。 これにより、Yandex が検索ランキングを調べる方法について貴重な洞察が得られました。
Yandex のソース コードから、Yandex 検索エンジンで使用されているいくつかの重要なスコアリング システムが明らかになりました。 これは疑問を投げかけます。 Google が同様のランキング要素を使用していると仮定できますか?
分析の結果、Yandex のランキング要因のリストは、Google から予想されるものよりも大幅に小さいことが明らかです。 ただし、これは、Yandex で使用される要因がそれほど重要ではないという意味ではありません。
実際、これまで SEO コミュニティは、Yandex で見られる要因の多くを認識していなかった可能性があります。 つまり、これらの要因を理解することで、今後の SEO の優位性が得られる可能性があります。
最適化戦略を再評価し、ページ ランキングを改善する新しい方法を発見する絶好の機会があるかもしれません。
さて、誤った情報を広めたと非難される前に、Google がこれらのランキング要素を使用していると言っているわけではありません。 私は質問をしているだけです。
また、このリークにより、スパマーがこれらのシステムを悪用する新たな機会がもたらされる可能性があることにも注意してください。 SEO の専門家として、警戒を怠らず、倫理的な最適化手法に注目し続けることが重要です。
ユーザーの行動
Yandex がユーザーの行動に重点を置いているのは非常に興味深いことです。 流出したソース コードによると、Yandex は Web ページの関連性と権限を判断する際に、クリック率 (CTR) や滞留時間などの指標を重視しています。 これには 150 のランキング要因があります (全要因の約 8%)。
また、Google が長年提唱してきたものと驚くほど似ている要素がたくさんあります。 私が言及しているのは、バックリンクやキーワードの使用など、従来の SEO 要素に重点を置いているということです。
ページを指すリンクの数と品質に基づいて Web ページをランク付けするシステムである PageRank を直接的または間接的に使用する要因は何百もあります (PageRank を発明した Google は、それに基づいてページを測定およびスコアリングする最初の検索エンジンです。 )
このリークの影響は、コンテンツを Yandex 向けに最適化しようとしている SEO 専門家にとって重要です。
全体として、Yandex のソース コードのリークは、主要な検索エンジンの内部動作に関する貴重な洞察を提供し、最適化戦略を改善する新たな機会を提供します。
分析と統計
数値について話し、いくつかの指標を削除しましょう。 私たちはマーケターとしてそうしなければなりません。 ;)
1922 のランキング要素があり、すべてここで見つけることができます。
ランキング要因はグループ化されています。 以下は、上位グループを示すチャートです。
さて、いくつかのランキング要因に入りましょう。
Yandexのランキング要因
情報を掘り下げると、注目に値する 2 つの明らかなテーマを特定できます。
- 注釈
- クエリ要因
注釈
私が見たところ、多くの要因がグループ化されています。 主要なグループの 1 つに Annotation があります。 このグループには、UX、CTR、直帰率、滞在時間などが含まれます。
私が見たところ、アノテーションは、ページ スコアのセマンティック分析と CTR 予測を含む主な要因です。 さらに、Annotation インデックスが存在する可能性があるようです。 彼らが複数のセマンティック加重係数を使用していることがわかります。 彼らが使用していると思われる独自の加重スキーマの中で、古典的な加重 BM15 を見つけることができます。
簡単に言えば、BM25 は、検索エンジンのインデックス内のドキュメントを測定し、ユーザーの検索クエリとの関連性を測定するアルゴリズムです。 これは、ドキュメント内の単語を測定するが、文法と単語の順序を無視し、単語がドキュメントに出現する頻度に焦点を当てたバッグ オブ ワード モデルです。
クエリ要因
2 番目はクエリ ファクターです。 これらの要因は、次のようなより一般的で単純な要因のようです。
- Wordcount (Factor #59) ここで、実際に使用された数式を確認できます: Min(クエリ単語数/10, 1.f) - それに応じてページのスパムを開始しないでください。 ;)
- 逆単語数 (ファクター #60): 「1 / number_of_words_in_query」という単純な式を示します。
- IDF (Inverse Document Frequency): これは、自然言語処理および情報検索で使用される尺度で、ドキュメントのコレクションまたはコーパスにおける用語の重要性を反映します。 一部のツールは、Rank Ranger TF-IDF レポートなどのレポートで使用しているため、ほとんどの SEO はこれに精通している必要があります。
- ここで非常に興味深いのは、クエリが NightQuery か MorningQuery か、また特定の時間帯を分類して考慮していることです。
ここでは、主要なランキング要因の簡単な要約を示します。
ランキング要因のまとめ
- PageRank は依然として SEO の要素です
- バックリンクは重要です
- CTR(クリックスルー率)と直帰率が大きな要因
- 404/5xx エラーに対処するための頻繁なサイト監査は、SEO の最適化に不可欠です
- 基本的な分析からより高度なセマンティック分析に至るまで、オンページ要因は引き続き SEO で一定の役割を果たします。
- Yandex 検索エンジンでのページのランキングは、URL がユーザーのブックマークに追加された回数や、検索エンジンからのクエリをクリックした後にページで費やされたアクティブな時間など、ユーザーの行動の影響を受ける可能性があります。 Yandex バーとブラウザー ツール。
- すべてのクエリでのドメインの平均掲載順位は、ランキング要因です。
- クロール深度はランキング要因です。
- URL が検索セッションで最後にアクセスされた場合、ユーザーが探していたものを見つけたことを意味します。
- サイトに Google アナリティクスがあることは、ランキング要因です。 想像してみろ…
- UX (ユーザー エクスペリエンス) には、ページ上のユーザー エクスペリエンスの品質を評価するさまざまな要素が含まれます。たとえば、壊れたビデオ、リンク、広告の数、ページのインタラクション、リピート アクセスなど、すべてが測定されます。
ランキング要因のいくつかを大まかに見てきたので、次に予想外の要因を見てみましょう。
これらの要因を調べることで、新しい視点が得られ、新しいテストの機会が得られることを願っています
新たな機会: 予想外のランキング要因
Yandex の検索アルゴリズムには、研究すべき複数の要素があり、その多くはスパマーによって悪用される可能性が高く、Google の検索を最適化する機会を提供するものもあります。 ここに私の目を引いたいくつかの観察があります。
ファクター #63 | 名前: HasNoQueryURLShows
翻訳された説明: 「このリクエストのこの URL のクリッカビリティ情報はありません。1 - リクエストまたはリクエスト URL はクリック ベースにありません。0 - リクエスト URL はクリック データベースにあります。」
たとえば、ランディング ページ URL が以前の検索でヒットしたかどうかがランキング要因だったとしたらどうでしょうか。 もしそうなら、この要因に影響を与えるために、最初のクリックをプッシュすることを検討することをお勧めします.
ファクター #850 | 名前: BrowserBookmarksUrl
この要素の説明は、「URL をブックマークに追加するユーザーが増えるほど、より多くの要素値を持つようになる」です。
本当に?
最初は古風に聞こえますが、さらに考えてみると、ユーザーが URL をブックマークする方法を測定する唯一の方法は、Yandex ブラウザーまたはバーです。 Google が Chrome で同じことをするのだろうか。 お気に入りへのページの追加を含む新しい SEO チェックリストが表示される可能性があります。
要因 #243 に続く、Yandex バーからのクリックストリーム データに基づく一連の要因
要因の 1 つの説明の翻訳を次に示します。「検索エンジンからのクエリをクリックした後の、ページでの平均アクティブ継続ユーザー時間 (秒単位)。(要因はペア (クエリ、URL) によって異なります。) Yandex.Bar / Elements / Browser の内部カウンターに」
Yandex.bar を使用して Web を検索し、結果をクリックするユーザーは、ページ ランクに影響を与えるようです。
重要ポイント
これまで見てきたように、Yandex には興味深い予想外のランキング要因がいくつかあります。
たとえば、Google は何年も前から、直帰率はノイズの多いシグナルであり、コンテンツのランキングにクリックスルー率は使用しないと述べてきました。
それでも、Yandex はこれらのシグナルをコンテンツのランキングに使用しているようです。 さて、上で述べたように、私はここで何の主張もしていません。 しかし、私は質問をしています。 これらの要因のいくつかは、Google がページをランク付けする方法に影響を与えますか?
Google がソース コードをすぐに公開する可能性は低いため、確認する唯一の方法は、ユーザー テストを少し行うことです。