抓取下一页 XHR 请求

Scraping next page XHR request

我想抓取这个用户的第二页reviews

然而,下一个按钮执行 XHR 请求,虽然我可以使用 Chrome 开发人员工具看到它,但我无法复制它。

这不是一件容易的事。首先你应该安装这个 extension。 它可以帮助您根据捕获的数据测试自己的请求,即用捕获的数据捕获和模拟请求。

我看到他们在这个 XHR 请求中发送了一个令牌,所以你需要从 html 页面正文中获取它(存储在源代码中,js 变量 "taSecureToken" )。

接下来需要做四步:

  1. 使用插件捕获 POST 请求
  2. 将令牌更改为之前保存的
  3. 在 POST 请求数据中设置 limitoffset 变量
  4. 生成带有结果正文的请求

注意:在此请求服务器上 returns json 数据(不是下一页的 html)包含有关下一页加载对象的信息。