如何检查或监控站点地图是否适用于特定网站
How to check or monitoring if sitemap works on particular websites
sitemap.xml
文件已在 Website.but 上创建,我的问题是如何以及在何处检查它是否成功 运行 或在特定网站上运行
不同的搜索引擎是不同的,但是对于Google,您可以去Google搜索控制台查看抓取统计。您可能必须注册您的网站,然后手动提交您的站点地图才能运行,但它会显示哪些页面已被抓取、每天抓取的页面数量、站点地图的任何错误等。
这里是 Search Console 的 link:
https://www.google.com/webmasters/tools/home?hl=en
Crowlet 正是这样做的(完全公开:我是维护者)。
它是一个轻量级的 CLI 程序,检查来自 sitemap.xml 的所有 URL,并报告是否存在响应代码或响应时间问题。
它基本上是一个单行代码,可以 return 遇到特定的基于退出代码的问题,或者被解析为 JSON (logstash, ...)。
项目在这里:https://github.com/Pixep/crowlet。
还有一个与您正在寻找的内容相匹配的示例:
# Return with code `150` if any page has a status != 200
docker run -it --rm aleravat/crowlet --non-200-error 150 https://foo.bar/sitemap.xml
sitemap.xml
文件已在 Website.but 上创建,我的问题是如何以及在何处检查它是否成功 运行 或在特定网站上运行
不同的搜索引擎是不同的,但是对于Google,您可以去Google搜索控制台查看抓取统计。您可能必须注册您的网站,然后手动提交您的站点地图才能运行,但它会显示哪些页面已被抓取、每天抓取的页面数量、站点地图的任何错误等。
这里是 Search Console 的 link: https://www.google.com/webmasters/tools/home?hl=en
Crowlet 正是这样做的(完全公开:我是维护者)。 它是一个轻量级的 CLI 程序,检查来自 sitemap.xml 的所有 URL,并报告是否存在响应代码或响应时间问题。
它基本上是一个单行代码,可以 return 遇到特定的基于退出代码的问题,或者被解析为 JSON (logstash, ...)。
项目在这里:https://github.com/Pixep/crowlet。
还有一个与您正在寻找的内容相匹配的示例:
# Return with code `150` if any page has a status != 200
docker run -it --rm aleravat/crowlet --non-200-error 150 https://foo.bar/sitemap.xml