SharePoint 2013 使用查询字符串参数抓取外部网站
SharePoint 2013 crawl external website with querystring parameter
我需要为我公司的员工手册编制索引,该手册托管在外部网站上。此页面需要登录,并支持通过查询字符串参数自动登录。
像这样:http://manual.externalprovider.com?token=xxxxxxxxx
在我的内容源中输入此 URL 时,我没有得到任何结果和以下警告:
Item not crawled due to one of the following reasons: Preventive crawl
rule; Specified content source hops/depth exceeded; URL has query
string parameter; Required protocol handler not found; Preventive
robots directive. ( This item was deleted because it was excluded by a
crawl rule. )
是否无法抓取起始地址中包含查询字符串参数的内容?关于如何解决这个问题还有其他建议吗?
我觉得可以,但是你需要创建新的抓取规则。
转到搜索服务应用程序 -> 抓取规则 -> 新建抓取规则。
然后粘贴您的起始 url: http://manual.externalprovider.com/* 并请检查 "Include all items in this path" 然后 "Crawl complex URLs (URLs that contain a question mark (?))".
我需要为我公司的员工手册编制索引,该手册托管在外部网站上。此页面需要登录,并支持通过查询字符串参数自动登录。
像这样:http://manual.externalprovider.com?token=xxxxxxxxx
在我的内容源中输入此 URL 时,我没有得到任何结果和以下警告:
Item not crawled due to one of the following reasons: Preventive crawl rule; Specified content source hops/depth exceeded; URL has query string parameter; Required protocol handler not found; Preventive robots directive. ( This item was deleted because it was excluded by a crawl rule. )
是否无法抓取起始地址中包含查询字符串参数的内容?关于如何解决这个问题还有其他建议吗?
我觉得可以,但是你需要创建新的抓取规则。
转到搜索服务应用程序 -> 抓取规则 -> 新建抓取规则。
然后粘贴您的起始 url: http://manual.externalprovider.com/* 并请检查 "Include all items in this path" 然后 "Crawl complex URLs (URLs that contain a question mark (?))".