将 Scrapy 与 CasperJS 相结合

Combining Scrapy with CasperJS

当我使用 Scrapy-Splash 尝试 Splash 时,它不支持像真正的浏览器那样的导航。它只呈现 HTML,但当它单击一个按钮时,它不会呈现它导航到的下一页。

根据我的简单研究,只有 CasperJS 支持带导航的网页抓取。但是,是否可以结合 Scrapy 和 CasperJS

您将浏览器与测试框架混淆了,Selenium 正是这样做的,但使用 PhantomJS 作为无头浏览器(CasperJS 使用的是 headless 浏览器)而不是 Firefox。

Click method

# Assume the button has the ID "submit" :)
driver.find_element_by_id("submit").click()

alexce answer on scrapy with selenium

如果您需要请求的内容,请使用类似 BrowserMob 的内容作为代理。