作为 SEO 专家,您可能花费了大量的精力来优化新鲜材料,但仍然没有发挥您的排名潜力。这可能是因为您忽略了一个看不见的威胁:索引膨胀。
索引膨胀给搜索引擎和网站所有者都带来了问题。它阻碍了搜索引擎算法识别有用信息的努力,导致网站抓取次数减少。
此外,它将高质量的材料隐藏在不太有用的页面后面,从而降低了网站的曝光度和总排名潜力。
幸运的是,解决索引膨胀问题很简单。我们将研究索引膨胀、它如何影响爬行预算以及实用的解决方案 增加您网站的在线曝光度.
什么是指数膨胀?
当您的网站包含数十个、数百个或数千个由 Google 索引的低质量页面且对潜在访问者没有用处时,就会发生索引膨胀。
这会导致搜索爬虫花费太多时间搜索网站上不相关的页面,而不是将精力集中在对您的业务有利的网站上。它还为网站访问者提供了糟糕的用户体验。
索引膨胀经常发生在拥有大量商品、类别和用户评论的电子商务网站上。由于技术困难,搜索引擎索引的低质量页面可能会使网站不堪重负。
简而言之,索引膨胀会导致您的网站速度变慢并浪费爬行资金。维护干净的网站可确保搜索引擎仅索引您希望用户查找的 URL。
索引膨胀的实际情况:一个例子
几年前,我们计划开发一个电子商务网站,大约有 10000页.
当我们访问 Google Search Console 时,我们惊讶地发现 Google 已为我们的域索引了 38000 个页面。考虑到该地点的规模,这个数字太高了。
(提示:您可以在“搜索控制台”>“索引”>“页面”下找到您网站的这些数字。)
这个数字在短时间内大幅增加。最初,Google Analytics 索引了 16000 个页面。
发生了什么事?
该网站的软件创建了数百个多余的产品页面。
从较高的层面来看,如果网站某个品牌的库存售罄(这种情况经常发生),分页算法会生成数百个额外页面。
由于该错误,网站索引猛增 - SEO 性能受到影响。
指数膨胀:为什么重要?
索引膨胀会增加您的搜索引擎的存在,其中包含没有任何目的或与访问者无关的内容。
当搜索机器人索引这些不相关的页面时,它是:
- 搜索引擎很难对您的网站进行排名。搜索爬虫必须理解您的网站,才能准确地将内容与用户请求匹配并对其进行排名。缺乏清晰、逻辑性目的的页面会使谷歌和其他搜索引擎更难理解和获取信息。
- 对搜索引擎排名产生负面影响。当具有可比内容的页面定位相同的关键字时,它们就会相互竞争。低质量的页面或重复的内容可能无法排名或引起读者的兴趣,从而降低网站的整体权威。
- 爬网预算使用效率低下。索引膨胀导致搜索机器人浪费有限的抓取预算来获取 Google 不需要的材料。这会分散您想要排名的页面的时间和资源。
如何诊断索引膨胀?
Google Search Console 覆盖率报告是发现导致索引膨胀的页面类型的最快且最可靠的技术之一。
已编入索引但未提交到 XML 站点地图的 URL(假设您的站点地图遵循 SEO 最佳实践并且仅包含 SEO 相关 URL.
如果您的 XML 站点地图不能以最佳方式表示合法页面,请使用无限抓取工具来查找可索引 URL 的数量。
如果您的合法页面比爬行的 URL 多得多,那么您肯定会遇到索引膨胀。
不要使用站点:搜索高级运算符来计算索引页面的数量;这是非常不准确的。
找到要取消索引的低价值页面后,将 URL 与 Google Analytics(分析)数据交叉引用,以确定对自然流量的预期影响。
由于其性质,它们通常不会产生有害影响,但在进行大规模去索引之前必须仔细检查。
索引膨胀如何影响 SEO 性能?
在线网站数量超过 1.13 亿,搜索引擎的“限制”抓取预算“ 为每一个。这意味着他们只能在给定时间范围内查看和分析特定数量的页面。
您网站的关键页面会被抓取,但由于索引膨胀而不会被编入索引,如果您的预算用完,索引过程将停止。
因此,您的内容将需要更长的时间才能 出现在搜索结果页面上,从而损害您网站的排名并降低转化率。
除了抓取预算限制之外,您的网站由 Google 索引的页面数量有限。
这使得大量的材料没有被触及,或许也鲜为人知。如果 Google 抓取竞争相同流量的不需要的页面,那么每月获得 7,000 次浏览的高质量页面可能只会获得 2,500 次浏览。
指数膨胀可能导致 点击率较低 以及糟糕的用户体验。
当用户遇到来自过大索引的页面时,他们必须筛选更多低质量的结果才能找到他们正在寻找的内容,从而导致网站上的跳出次数增多,点击次数减少。
随着时间的推移,这会降低你的点击率,导致谷歌对你失去信心并降低你的排名。
以下是索引膨胀如何影响 SEO 健康状况的概述:
- 将昂贵的抓取预算浪费在对业务增长毫无贡献的页面上。
- 损害排名,降低流量,并最终降低转化率。
- 降低点击率并创造糟糕的用户体验。
简而言之,索引膨胀会显着延迟您的 SEO 进度,同时悄悄降低您的搜索引擎优化的有效性。 最伟大的内容。这就像试图摆脱流沙一样;它每走一步都会让你失望。
如何修复索引膨胀?
A。进行指数审计
探索 Search Console 和 Google Analytics 以确定索引页面的价值。分类为:
- 维护的基本内容
- 中等绒毛以增强或凝固
- 删除或重新路由无用的僵尸页面
通过以这种方式分割页面,您可以揭示整合和修剪的可能性,使您能够轻松地改变历史内容资产。最能满足用户需求的网站区域的持续链接流量。
此技术还将显示网站设计中需要新内容放置的漏洞。
b.删除内部链接
如果您打算不对您的材料建立索引,则删除其内部连接将降低 Google 检测和索引它的能力。
由于 Google 利用内部链接在您的网站上查找新材料,因此删除该渠道会导致 Google 将注意力集中在您页面上的其他内部连接上并扫描它们。
如果您希望删除不必要的页面,删除这些页面的内部连接将减少链接损坏的可能性,并允许您链接到您希望 Google 找到的更相关的信息。
C。 301 重定向
如果您的网站有许多包含相同或类似信息的 URL,请使用 301 重定向到所需的页面规范版本。
这将直接将权益和排名信号链接到 规范网址,消除重复站点的索引膨胀。
d.设置正确的规范标签
Google 会优先考虑标题部分中包含规范标签的网站 ( ) 用于索引。
在建立索引时,我们防止重复页面并巩固链接资产,将其重定向到主页。
e.更新或安装robot.txt
如果您的网站还没有 robots.txt 文件,请创建一个。为了确保搜索爬虫到达正确的网站,建议我们定期检查和更新当前的 robots.txt 文件。
robots.txt 文件可防止搜索引擎机器人访问子目录。例如,我们阻止 Google 抓取用户生成的搜索结果。
如果我们的 robots.txt 文件没有实现这一点,Google 可能会访问、抓取并索引我们不希望出现在搜索结果中的数千个页面,从而耗尽其抓取预算。
F。使用 Google Search Console 的网址删除工具
添加“没有索引”指令可能不是一个快速的解决办法,谷歌可能会继续索引这些页面,这就是为什么 URL 删除工具 有时可能有用。
然而,使用此程序只是作为临时补救措施。当您请求 Google 时,它会立即从索引中删除这些页面(通常在几个小时内,具体取决于查询量)。
删除工具与无索引指令结合使用时效果最佳。请记住,您所做的任何删除将来都是可逆的。
G。使用 Meta Robot 标签和 X-robots
HTML 文档可以添加机器人元标记来提供有关单个页面的信息,而不会影响站点范围的机器人。您可以更好地控制每个页面的抓取方式。
它还可以包含针对特定爬虫(“Google bot”或“Bing bot”)的说明,并省略 Google 图片、视频和新闻搜索中的页面。必须在您不希望搜索引擎抓取的页面上使用元机器人标记。
如果您无意中向不应该根据您的 robots.txt 文件建立索引的页面添加无索引标记。
X-Robots 标签出现在 HTTP 标头响应中。它的用途与元机器人标签相同,控制照片、视频、PDF 和其他非 HTML 文档的索引。
H。正确实施分页
如果您的网站有分页材料(例如产品列表或文章档案),请使用 rel=”next” 和 rel=”prev” 标签向搜索引擎指示适当的分页。
这可以阻止他们单独索引每个分页页面,从而减少索引膨胀。
结论
索引膨胀是一个普遍存在的问题,会影响网站在搜索引擎结果页面中的性能和用户体验。
搜索引擎对不相关网站的过多索引埋葬了有用的材料。这会导致排名稀释和爬行资源浪费。
然而,认识到原因并采取适当的技术补救措施可以 提高整体 SEO 性能.
您可以识别网站上的哪些页面存在索引膨胀,并使用上面讨论的技术消除它们。
这可以帮助您提高网站在搜索引擎中的整体质量评价,排名更高,并创建更清晰的索引,让 Google 能够快速有效地识别您想要排名的页面。
常见问题
1.什么是爬行膨胀?
当 Google 等搜索引擎对网站上大量不相关、冗余或低质量的页面建立索引时,就会发生这种情况。索引膨胀的存在会不均匀地分配抓取预算并影响搜索引擎的整体质量评估,从而削弱网站的 SEO 工作。
2. 如何解决页面索引问题?
当您直接要求 Google 为某个页面建立索引(通过将其添加到站点地图或手动请求索引),但该页面没有索引标记时,就会出现此问题。补救措施很简单:删除 noindex 标签,以便 Google 可以访问该页面。
3. 如何从索引中删除页面?
要防止 URL 或域显示在 Google 搜索结果中,请在要删除的页面标题中使用 noindex 标记。取消索引是从 Google 搜索索引中删除现有 URL 的过程。