以编程方式抓取 Sharepoint 2013

Programmatically crawl Sharepoint 2013

我是 SharePoint 2013 .Net 客户端的新手 API。我想以编程方式对整个 SharePoint 网站进行爬网。我想完全提取列表、文档、页面,所有的东西!

理想情况下,我想从网站的根目录开始,然后从那里抓取所有内容。

有人可以简要概述所涉及的基本步骤吗?例如,我是否需要创建一个目录,或者如果我有管理员凭据,我可以简单地爬取吗?

我正在使用 C#、.Net 4.0 和客户端运行时 API(不是 REST)。

一些对我有帮助的链接: 1. 用 Rest API 或 PowerShell 抓取 - Start a crawl manually via SOAP or REST WebService 2. 使用代码重新抓取 - http://sebastian.expert/force-web-whole-list-library-re-crawled-search-sharepoint-2013-using-api/

我相信 SharePoint 中的所有内容都在一个列表下。本质上,我获取属于 Web 的列表并从中获取所有 ListItems。我忽略了文件夹和文件集合,因为它们是重复的。