Page 1 of 1

Google 可以访问该页面

Posted: Sat Feb 22, 2025 8:32 am
by Joywtome231
报告中有许多不同的“状态”,为网站管理员提供有关 Google 如何处理其网站内容的信息。虽然许多状态提供了一些有关 Google 抓取和索引决策的背景信息,但有一个状态仍不清楚:“已抓取 - 目前未编入索引”。

自从看到“已抓取 - 当前未编入索引”状态报告后,我们收到了多位网站所有者的来信,询问其含义。在代理机构工作的好处之一是能够掌握大量数据,而且由于我们在多个帐户中都看到了此消息,因此我们开始从报告的 URL 中了解趋势。

谷歌的定义
我们先从官方定义开始说起。根据Google 的官方文档,这个状态的意思是:“该页面已被 Google 抓取,但尚未编入索引。将来可能会也可能不会被编入索引;无需重新提交此 URL 进行抓取。”

因此,我们基本上知道的是:

Google 花了时间抓取页面
抓取后,Google 决定不将其纳入索引
理解这一状态的关键是思考 Google 为何“有意识地”决定不将其编入索引。我们 阿尔及利亚 手机号码数据 知道 Google 找到该页面并不困难,但出于某种原因,它觉得用户找到该页面不会有什么好处。

这可能非常令人沮丧,因为您可能不知道为什么您的内容没有被编入索引。下面我将详细介绍我们团队见过的一些最常见的原因,以解释为什么这种神秘状态可能会影响您的网站。

1. 误报
优先级:低
我们的第一步始终是对“已抓取 - 当前未编入索引”部分中标记的URL进行一些抽查,以进行索引。经常会发现一些 URL 被报告为已排除,但最终却被 Google 编入了索引。

但是,使用站点搜索运算符时,我们可以看到该 URL 实际上已包含在 Google 的索引中。您可以在 URL 前附加文本“site:”来实现这一点。

站点搜索示例
如果您看到报告的 URL 处于此状态,我建议先使用站点搜索运算符来确定该 URL 是否已被编入索引。有时,这些结果是误报。

解决方案:什么也不做!这样就很好了。
2. RSS 源 URL
优先级:低
这是我们看到的最常见示例之一。如果您的网站使用 RSS 源,您可能会发现 URL 出现在 Google 的“已抓取 - 当前未编入索引”报告中。很多时候,这些 URL 的末尾会附加“/feed/”字符串。它们可以像这样出现在报告中:

已抓取 - 当前未编入索引报告中的 Feed URL 示例
Google 会从主页找到这些 RSS 源 URL。它们通常会使用“rel=alternate”元素进行链接。Yoast 等 WordPress 插件可以自动生成这些 URL。

解决方案:什么也不做!这样就很好了。
Google 很可能有选择地不索引这些 URL,这是有充分理由的。如果您导航到 RSS 源 URL,您将看到如下所示的 XML 文档:

Feed URL XML 文档
虽然此 XML 文档对于 RSS 源很有用,但 Google 无需将其纳入索引。这将带来非常糟糕的体验,因为内容不是为用户准备的。