首页 » 谷歌的分层索引系统

谷歌的分层索引系统

在最近一期Google 的 Search Off The Record Podcast节目中,Google 的 Gary Illyes 透露了 Google 如何使用分层系统进行索引。最受欢迎的内容被编入更快、更昂贵的存储中,而大部分索引则被编入更便宜且在发生故障时易于更换的存储系统中。

在 SEO 世界中,没有办法优化您的内容以便在更快的索引层上被索引,或者以任何方式确切地知道您的内容在哪个层上被索引,但是这确实可以很好地了解 Google 的索引功能。

层级

Gary Illyes 确认 Google 在以下 3 种类型的存储中对内容进行索引:

RAM(随机存取存储器)——最快、最昂贵的存储选项
SSD(固态硬盘)——速度非常快,价格适中,中等价位
HDD(硬盘驱动器)——速度最慢,但成本最低,发生故障时最容易更换

Google 为可能频繁出现在搜索结果中的内容/文档保留 RAM 索引。使用 RAM 和 SSD 等更快存储选项提供的 Google 索引量占 Google 整体索引的极小部分。Gary 引用道:

“例如,对于我们知道每秒都会出现的文档,它们最终 洪都拉斯电话号码表 会放在速度超快的设备上。速度超快的设备就是 RAM。我们的部分服务索引就在 RAM 上。然后我们会有另一个层级,例层索引系统如固态硬盘,因为它们速度快,而且不像 RAM 那么昂贵。但仍然不是——大部分索引不会放在固态硬盘上。大部分索引会放在便宜、可访问、易于更换且不会花费太多的设备上。那就是硬盘”。

与 HDD 相比,使用 RAM 和其他更快选项运行哪怕一小部分索引的成本也会高得多,但根据某些内容/文档对某些搜索的受欢迎程度,这可能是合理的。

洪都拉斯电话号码表

那么如何选择等级?

Gary 说道:

“当我们建立索引时,我们会使用我们层索引系统拥有 吃掉那只青蛙:减少拖延、提高效率的关键 的所有信号。让我们选择一个,比如说,页面排名,然后我们试着估计我们将为索引的文档提供多少服务。那么它会是每秒一次吗?我们会有一个触发这些文档的查询吗?还是每周一次或每年一次?基于此,我们可能会使用不同类型的存储来构建索引。”

我们怀疑,与热门主题(最近是美国总层索引系统统选举 新闻 美国 和冠状病毒)相关的文档将被放在更快的索引层级上。这些主题的搜索需求将非常高,以至于 Google 想要影响向搜索者提供文档的任何延迟。

概括
虽然你不能将分层优化纳入 SEO 活动,但这是另一个罕见而有趣的见解,了解 Google 索引如何根据搜索需求进行分层。

类似文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注