使用 RSelenium 下载 pdf

Downloading a pdf using RSelenium

我想用 RSelenium 包做的是,

步骤:1 访问网站 - 我自己的电力供应商

步骤 2 通过明确提供我的用户名和密码来访问我的帐户(这就是我无法共享代码的原因)

步骤:3 我点击'VIEW MY BILL'。 帐单以 pdf 格式显示。

有没有办法下载该文件并保存到特定文件夹? 当我使用 download.file() 命令时,它没有保存文档,而是我得到一个 3KB 的 pdf 文件,我无法打开。 Adobe Reader 表示读取文档时出错。

我尝试过的可能方法: 1. 右击,按四次向下箭头然后到达'SAVE PAGE AS'点击回车

但随后会弹出一个对话框,询问文件名和位置,我无法通过 RSelenium 输入这些详细信息并保存文件。

示例代码:在线找到的一些随机 PDF。

url<- "http://www.immigrationpolicy.org/sites/default/files/docs/how_us_immig_system_works.pdf"

setwd("C:/Users/king/Desktop/bill")
library(RSelenium)
library(downloader)
checkForServer()
startServer()
remDr <- remoteDriver()
remDr$open()
remDr$navigate(url)

我在不断的研究中找到了答案。

首先检查是否Rtools is installed(使用这个link找到答案)

然后更新了我的程序

cprof<-makeFirefoxProfile(list(
  "pdfjs.disabled"=TRUE,
  "plugin.scan.plid.all" = FALSE,
  "plugin.scan.Acrobat" = "99.0",
  "browser.helperApps.neverAsk.saveToDisk"='application/pdf',
  ))
remDr <- remoteDriver(extraCapabilities=cprof)

仍在尝试更改我尚未找到的下载文件夹。我从 THIS link

找到了答案