Yandex 泄漏将如何永远改变您的 SEO 游戏计划

已发表: 2023-01-31

最近，Yandex 的部分源代码被泄露。

这对您的 SEO 前进意味着什么？

想想这个……

了解他们的源代码会让您瞥见搜索引擎的内部工作原理。这使您有机会分析 Yandex 排名因素并将其与 Google 使用的因素进行比较。

尽管谷歌以其复杂而丰富的数据而著称，但值得注意的是，Yandex 在某些地区（尤其是俄罗斯）仍然占据着重要的市场份额。 Yandex 源代码泄漏是 SEO 社区了解 Yandex 如何对页面进行评分和排名的宝贵机会。

在这篇文章中，我将分解我们看到的一些高级主题，并向您展示算法的一些独特元素，这些元素可能会改变您进行 SEO 的方式。

但首先，让我们探讨一下为什么分析 Yandex 算法如此重要。

为什么看 Yandex？

Yandex 泄漏让我们第一次有机会看到主要搜索引擎的实际源代码。如您所知，Google 一直提供不透露搜索引擎细节的一般性建议。

这意味着我们一直依靠用户测试来了解如何使我们的内容在搜索结果中更加明显。

现在，我们第一次可以看到 Yandex 搜索算法的一些内部工作原理，包括用于确定网页相关性和权威性的排名因素的详细信息。这为了解 Yandex 查看搜索排名的方式提供了宝贵的见解。

Yandex 的源代码揭示了 Yandex 搜索引擎使用的一些重要评分系统。这就引出了一个问题。我们可以假设谷歌使用类似的排名因素吗？

经过分析，很明显 Yandex 的排名因素列表明显小于我们对 Google 的预期。然而，这并不意味着 Yandex 使用的因素不那么重要。

事实上，直到现在，SEO 社区可能还没有意识到我们在 Yandex 中看到的许多因素。这意味着了解这些因素可能会给您带来 SEO 优势。

您可能有一个千载难逢的机会来重新评估您的优化策略，并可能发现提高网页排名的新方法。

现在，在我被指控传播错误信息之前，我并不是说 Google 使用了这些排名因素中的任何一个。我只是在问这个问题。

此外，值得注意的是，此次泄漏还可能为垃圾邮件发送者提供利用这些系统的新机会。作为 SEO 专业人士，重要的是要保持警惕并继续关注道德优化技术。

用户行为

看到 Yandex 对用户行为的重视非常有趣。根据泄露的源代码，Yandex 在确定网页的相关性和权威性时，会大量考虑点击率 (CTR) 和停留时间等指标。围绕此有 150 个排名因素（约占所有因素的 8%）。

此外，有许多因素听起来与谷歌多年来一直倡导的内容惊人地相似。我指的是强调传统的 SEO 因素，例如反向链接和关键字使用。

直接或间接使用 PageRank 的因素有数百种，PageRank 是一种根据指向网页的链接的数量和质量对网页进行排名的系统（发明了 PageRank 的 Google 是第一个基于它衡量和评分网页的搜索引擎。 )

对于希望为 Yandex 优化内容的 SEO 专业人士而言，此次泄露的影响意义重大。

总的来说，Yandex 源代码的泄露提供了对主要搜索引擎内部运作的宝贵见解，并提供了改进优化策略的新机会。

分析与统计

让我们谈谈数字并放弃一些指标。我们必须作为营销人员。 ;)

有 1922 个排名因素，你可以在这里找到它们。

排名因素组合在一起。下面的图表显示了排名靠前的群体。

好的，让我们了解一些排名因素。

Yandex 排名因素

深入研究这些信息，我可以确定两个值得注意的明显主题：

注解
查询因素

注解

在我看来，许多因素组合在一起。其中一个领导小组称为 Annotation。该组包括用户体验、点击率、跳出率和停留时间等内容。

在我看来，注释是一个主要因素，包括页面得分和 CTR 预测的语义分析。更何况，好像还有注释索引。我们可以看到他们使用的不仅仅是一个语义加权因子。您可以在他们似乎使用的专有加权模式中找到经典的加权 BM15。

简单地说，BM25 是一种算法，可以衡量搜索引擎索引中的文档，并衡量它们与用户搜索查询的相关性。它是一个词袋模型，衡量文档中的词，但忽略语法和词序，关注词在文档中出现的频率。

查询因素

排在第二位的是查询因素。这些因素似乎是更常见和简单的因素，例如：

Wordcount（因素 #59），您可以在其中看到实际使用的公式：Min(查询词数/10, 1.f) - 请不要相应地开始垃圾页面。 ;)
Inverted wordcount（因子 #60）：显示一个简单的公式“1 / number_of_words_in_query”。
IDF (Inverse Document Frequency)：这是一种用于自然语言处理和信息检索的度量，用于反映某个术语在文档集合或语料库中的重要性。大多数 SEO 应该熟悉它，因为一些工具在报告中使用它，例如 Rank Ranger TF-IDF 报告。
这里非常有趣的是看到他们分类并考虑查询是 NightQuery 还是 MorningQuery，以及在特定时间。

现在，这里有更多内容可供查看。我只是在查看注释和查询因素，以使这篇文章尽可能简短。

以下是关键排名因素的简要总结。

排名因素总结

PageRank 仍然是 SEO 的一个因素
反向链接至关重要
CTR（点击率）和跳出率是主要因素
频繁的站点审核以解决 404/5xx 错误对于优化 SEO 至关重要
页面因素继续在 SEO 中发挥作用，从基本分析到更高级的语义分析
Yandex 搜索引擎上的页面排名可能会受到用户行为的影响，包括将 URL 添加到用户书签的次数以及点击搜索引擎查询后在页面上花费的活动时间，衡量标准是Yandex 栏和浏览器工具。
所有查询的平均域位置是排名因素。
爬网深度是一个排名因素。
如果某个 URL 是搜索会话中最后访问的，则意味着用户已找到他们要查找的内容。
在网站上安装 Google Analytics 是一个排名因素。想象一下…
UX（用户体验）包括评估页面上用户体验质量的各种因素，例如损坏的视频、链接、广告数量、页面交互和重复访问，所有这些都会被衡量。

既然我们已经从较高的层面研究了一些排名因素，现在让我们来看看一些更意想不到的因素。

研究这些因素会给你一个新的视角，并希望给你一些新的机会来测试

新机遇：意想不到的排名因素

Yandex 的搜索算法提供了多个要研究的元素，其中许多元素可能会被垃圾邮件发送者利用，其他元素则提供了针对 Google 搜索进行优化的机会。以下是引起我注意的一些观察结果。

因素 #63 | 名称：HasNoQueryURLShows

翻译后的描述：“此请求的 URL 没有可点击性信息 1 - 请求或请求 URL 不在点击库中，0 - 请求 URL 在点击数据库中”

以这个为例，如果您的着陆页网址是否在之前的搜索中被点击是一个排名因素怎么办？如果是这样，您可能需要考虑推动初始点击以影响此因素。

#850 因子 | 名称：BrowserBookmarksUrl

这个因素的描述是“用户将网址添加到书签的次数越多，它的因素值就越大”。

真的吗？

起初，这听起来确实很老派，但进一步考虑，他们衡量用户如何将 URL 加入书签的唯一方法是在 Yandex 浏览器或 Bar 上。我想知道谷歌是否对 Chrome 做了同样的事情。我们可能会看到新的 SEO 清单，其中包括将页面添加到收藏夹。

因素 #243 之后是一系列基于 Yandex 栏中的点击流数据的因素

这是对其中一个因素的描述的翻译：“点击搜索引擎查询后页面上的平均活动连续用户时间（以秒为单位）。（该因素取决于对（查询，url））。根据到 Yandex.Bar/Elements/Browser 的内部计数器”

似乎使用 Yandex.bar 搜索网页并点击结果的用户会影响页面排名。

一些关键要点

正如您所看到的，根据我们所看到的，Yandex 具有一些有趣且意想不到的排名因素。

例如，谷歌多年来一直表示跳出率是一个嘈杂的信号，他们不使用点击率来对内容进行排名。

然而，Yandex 似乎可能正在使用这些信号对内容进行排名。现在，正如我上面提到的，我在这里不做任何声明。但我在问这个问题。其中一些因素会影响 Google 对网页的排名吗？

由于谷歌不太可能很快分享其源代码，唯一的方法就是进行一些用户测试。