以编程方式抓取 Sharepoint 2013

Programmatically crawl Sharepoint 2013

我是 SharePoint 2013 .Net 客户端的新手 API。我想以编程方式对整个 SharePoint 网站进行爬网。我想完全提取列表、文档、页面，所有的东西！

理想情况下，我想从网站的根目录开始，然后从那里抓取所有内容。

有人可以简要概述所涉及的基本步骤吗？例如，我是否需要创建一个目录，或者如果我有管理员凭据，我可以简单地爬取吗？

我正在使用 C#、.Net 4.0 和客户端运行时 API（不是 REST）。

一些对我有帮助的链接： 1. 用 Rest API 或 PowerShell 抓取 - Start a crawl manually via SOAP or REST WebService 2. 使用代码重新抓取 - http://sebastian.expert/force-web-whole-list-library-re-crawled-search-sharepoint-2013-using-api/

我相信 SharePoint 中的所有内容都在一个列表下。本质上，我获取属于 Web 的列表并从中获取所有 ListItems。我忽略了文件夹和文件集合，因为它们是重复的。