旧的停车页面信息与新抓取网站的搜索结果混合在一起

Old parking page info is mixed in with search results for a newly crawled site

我通过注册商将我的域设置为停放页面。名称服务器已更改(我正在使用 Azure DNS),我已更新 robots.txt 并提交了站点地图。我已请求 Google 抓取我的网站,我们现在显示在 Google 的搜索结果中。

问题在于,对于搜索结果中显示的每个标题 link,停车页面中的一些信息被附加到末尾。

所以结果 link 可能会说 About Us | Example Company - example.com - nameOfRegistrar.

About Us | Example Company 是正确的,但 - example.com - nameOfRegistrar 似乎是 停车信息 页。

URL 和文字描述都很好,只是标题 link 搞砸了,因为它们 添加 URL 网站名称和注册商的名称。我认为此信息在停车页面的标题中。

如何删除这些旧的(可能是缓存的)信息?我需要联系 Google 吗?我的注册商?我要再请求一次爬行吗?为什么会这样?

So the result link might say "About Us | Example Company - example.com - nameOfRegistrar". "About Us | Example Company" is correct, but "- example.com - nameOfRegistrar" seems to be old info from the parking page. The URLs and text descriptions are fine, it's just the title links that are messed up because they add the URL of the site again and the name of the registrar.

最好在 .htaccess 文件中写一个 301 redirect。通过 this and 了解其工作原理并加以实施。它应该会立即修复您的旧 url 错误。

使用 301 redirects,您将在服务器级别编写说明,这将使它能够将其重定向到您提到的 url 的页面。因此,即使您的搜索结果指向旧 url(直到 Google 修复它),当您的服务器收到指向旧 url 的请求时,它会将其重定向到新 url 您在 .htaccess 文件中提到的。此外,在您的 robots.txt 中,请确保您也允许机器人抓取 .htaccess 文件。机器人很容易知道您已将 url 移动到较新的。

此外,如果您想要 remove 旧的 url 当前不存在于您的站点中,那么您可以向 Google 使用此 Google Help Answer 删除它们。更不用说,这些链接可能需要几天时间才能消失。

我使用 Google Search Console 解决了这个问题。我多次请求重新抓取整个网站,但在 5 或 6 天后,尽管该网站显然正在缓慢抓取,但没有任何改善。然后,对于 Google 中出现的每个混乱结果,我请求抓取单个页面,而不抓取该页面上的其他链接。那是昨天,现在一切似乎都很好,这些页面在 Google 中显示正常。

所以 Google 最终会重新抓取您的整个网站,只是需要时间。通过提交要抓取的单个页面(无需请求抓取该页面上的其他链接),您可以加快修复单个页面的混乱结果。

我很惊讶抓取过程并没有更快,但这很好,因为它不会对我的资源造成太大的影响。

至于为什么会发生,我不确定,但我怀疑 DNS 信息没有时间传播。现在没关系了。