今年一月份的时候,Alex Buraks 根据 Yandex 泄露的源代码库深扒了其搜索引擎的排名规则。由于Yandex 搜索引擎和 Google 搜索引擎的搜索结果有 70% 的匹配度,甚至有不少人认为 Yandex 用的就是与 Google 搜索引擎的同款技术(如 PageRank、BERT 等)。所以这份泄露的代码资料就对于研究谷歌搜索引擎排名算法有一定的参考意义。
这份资料现在已经完全公开了,且我今天也一直在看这份资料,所以干脆写篇文章记录下相关信息(只是记录,毕竟我也在学习)。
等不及的朋友可以先看这篇文章:Complete Internal List of Yandex Ranking Factors

有大佬对这份泄露代码资料进行了分析,发现 Yandex 搜索排名因子有 1922 个,大到 PageRank 这种耳熟能详的技术,小到具体的技术实现细节。
点击排名因素可以看到全部信息。

同时,现在网上也有很多大佬在对这些因素进行分析与解读,具体内容我也处于学习阶段,实在不能输出太多内容,后面再记录下学习与思考成果。
简单列一些 Yandex 的排名因素:
- 1、链接的创建时间。
- 2、流量和自然流量的百分比。
- 3、URL 中的数字不利于排名。
- 4、URL 中的斜杠不利于排名。
- 5、负面情绪过重的内容其 PageRank 等于 0。
- 6、服务器主机可靠性。
- 7、用户行为,点击率、跳出率等。
- 8、文件年龄与上次更新日期。
- 9、所有查询域名的平均位置。
- …