post 的 R 包 js 加载网络抓取而不依赖外部无头浏览器

R package for post js load webscraping without relying on an external headless browser

我需要使用 R 从异步网页中抓取内容并嗅探网络 activity。 问题是在我的团队中,我们在通过 github.

共享的项目目录中的 Mac 和 Windows 机器上工作

这在通过 RSelenium 使用外部无头浏览器时产生了相当大的问题(mac/windows 路径差异、可执行文件的不同位置、协作者的动态数量)。

所以一个理想的解决方案是使用一些直接用 R 编写并作为包安装的简单无头浏览器,这样我们就不必关心 OS 支持、位置等。 .

有这样的包吗?

看起来现在有解决方案可以通过像 https://github.com/rstudio/chromote or https://github.com/RLesur/crrri 这样的包来做到这一点,而不需要安装任何无头浏览器,因为最近 Chrome 公开了一个 API 来与之交互。