使用 R curl 下载 Twitter 页面时,下载的页面是 "This browser is no longer supported"

When using R curl to download a Twitter page, the page downloaded is "This browser is no longer supported"

因此,我有一个脚本使用 curl_download 下载 Twitter 页面,然后使用 read_html 从中获取一些数据。它以前工作正常,但现在,它不再下载正确的 Twitter 页面,而是下载此页面:

我不确定 Curl 怎么会出现错误的浏览器,或者如果出现错误该如何更改,但这是一个非常新的问题。我这样做的原因是脚本可以从 .html 文件中获取关注者的数量(并用它做一些其他不相关的事情),所以如果有人恰好知道一个更简单的方法这样做我是开放的,但除此之外,我希望有人已经看到了这个 Curl 问题。

这是我的代码:

library(curl)

twitter_file <- "location the file is meant to be saved"

curl_download("https://twitter.com/SelectFulton", twitter_file, quiet = TRUE)

谢谢!

@r2evans 关于更改用户代理的工作是正确的!这是我最终使用的代码:

withr::with_options(list(HTTPUserAgent="Googlebot/2.1 (+http://www.google.com/bot.html)"), curl_download("https://twitter.com/SelectFulton", twitter_file, quiet = TRUE))

并且不再有任何问题。感谢您的帮助!