Yandex 泄密事件揭露 1,922 个影响搜索排名的因素


SEO 人员已经开始分析 Yandex 的搜索排名因素,其中包括 PageRank 和其他几个与链接相关的因素

据称,一名前员工泄露了 Yandex 源代码库,其中一部分包含搜索引擎用于在搜索结果中对网站进行排名的 1,900 多个因素。

我们为什么关心。此次泄密事件至少截至 2022 年 7 月,揭露了 Yandex 在其搜索算法中使用的 1,922 个排名因素。也许Martin MacDonald 今天在 Twitter 上说得最好:“Yandex 黑客攻击可能是 SEO 领域多年来最有趣的事情。”

Yandex 不是 Google。如果您打算阅读 Yandex 排名因素的完整列表,请记住 Yandex 不是 Google。如果您看到 Yandex 列出的排名因素,这并不意味着 Google 会给予该信号同样的权重。事实上,Google 可能不会使用列出的所有 1,922 个因素。事实上,此次泄漏中的许多因素已被弃用或未使用。

尽管如此,许多排名因素可能与 Google 用于搜索的信号非常相似。因此,查看本文档可能会提供一些有用的见解,以更好地帮助您从技术角度了解 Google 等搜索引擎的工作原理。

更宏观的视角。Bleeping Computer报道,该代码以 Torrent 的形式出现在一个流行的黑客论坛上:

…泄密者发布了一个磁力链接,他们声称这是“Yandex git 源”,包含 2022 年 7 月从该公司窃取的 44.7 GB 的文件。这些代码库据称包含该公司除反垃圾邮件规则之外的所有源代码。

Yandex 称这是一次泄密。由于该代码出现在一个流行的黑客论坛上,人们最初认为 Yandex 遭到了黑客攻击。Yandex 对此予以否认,并发表了以下声明:

“Yandex 并未遭到黑客攻击。我们的安全服务在公共域中的内部存储库中发现了代码片段,但内容与 Yandex 服务中使用的存储库的当前版本不同。

存储库是用于存储和使用代码的工具。大多数公司内部都以这种方式使用代码。

存储库是处理代码所必需的,并非用于存储个人用户数据。我们正在对向公众发布源代码片段的原因进行内部调查,但我们没有发现对用户数据或平台性能有任何威胁。”

深入挖掘。你可以在Techmeme上找到更多关于此次泄密的报道。

Yandex 排名因素列表。MacDonaldWeb Marketing School 上分享了 1,922 个因素的完整列表。我强烈建议您下载它,因为我完全相信 Yandex 会试图从互联网上删除这些信息。(编者注:在本文的早期版本中,我们链接到了 Dropbox 上的翻译版本,但该链接很快就消失了。)

排名因素的早期分析。Alex Buraks 创建了两个 Twitter 主题(第一个主题第二个主题)来分析各种排名因素。Michael King 还发布了另一个有趣的Twitter 主题。

Dan Taylor 还在《Yandex 数据泄露:我们对俄罗斯搜索新闻的搜索算法了解多少》中分享了一些发现。

Yandex 的许多排名因素都是您所期望看到的:

  • PageRank 和许多与链接相关的因素(例如年龄、相关性等)。
  • 文本相关性。
  • 内容年龄和新鲜度。
  • 最终用户行为信号。
  • 主机可靠性。
  • 一些网站会受到优先对待(例如,维基百科)。

SEO 发现的一些排名因素令人惊讶:独立访客数量、自然流量百分比和查询的平均域名排名。

正如泰勒指出的那样,244 个排名因素被归类为未使用,988 个被归类为已弃用,“这意味着 64% 的文档要么未被积极使用,要么已被取代 – 因此它更像是约 690 个潜在排名因素,其中很多都包含较薄弱的描述。”

Yandex 搜索排名因素浏览器。Rob Ousbey创建了Yandex 搜索排名因素浏览器,这是一种搜索各种排名因素的工具。

深入挖掘。Michael King深入研究了Yandex 抓取的 Google 代码以及 Search Engine Land 上源代码泄露的其他 SEO 知识。结果发现,排名因素实际上有 17,854 个,而不是 1,922 个。还有一些其他发现:排名因素的初始权重、前 5 个负权重和正权重初始排名因素、链接因素和优先级等等。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注