当我在 R 中使用 rvest 包解析网站时,我的用户代理是什么?

What's my user agent when I parse website with rvest package in R?

因为在 R 中很容易,我使用 rvest 包来解析 HTML 从网站中提取信息。

我想知道请求期间我的 User-Agent(如果有的话)是什么,因为 User-Agent 已分配给互联网浏览器,或者是否有办法以某种方式设置它?

我打开会话并从 HTML 中提取信息的代码如下:

library(rvest)
se <- html_session( "http://www.wp.pl" ) %>% 
html_nodes("[data-st-area=Glonews-mozaika] li:nth-child(7) a") %>%
html_attr( name = "href" )

我用https://httpbin.org/user-agent发现:

library(rvest)
se <- html_session( "https://httpbin.org/user-agent" )
se$response$request$options$useragent

答案:

[1] "libcurl/7.37.1 r-curl/0.9.1 httr/1.0.0"

请参阅 this bug report 了解覆盖它的方法。

我在教程的某个地方找到了这个,它看起来是一种更简单、更快捷的方法:

uastring <- "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"
session <- html_session("https://www.linkedin.com/job/", user_agent(uastring))