使用 rvest 对 Google 搜索结果进行网络抓取时出现字符 (0) 错误

Question

我正在尝试抓取 Google 搜索的 headers。但是，无论我用 rvest 尝试什么，结果总是 returns character(0).

这是搜索代码 rstudio:

library(rvest)
library(dplyr)

web1 <- read_html("https://www.google.at/search?q=rstudio") 
header <-web1 %>%
    html_nodes(".DKV0Md") %>%
    html_text()
header

我在 SelectorGadget 中签入的节点名称，所以这应该不是问题。我该如何解决这个问题？

Answer 1

也许，我们可以使用：

library(rvest)
library(dplyr)
web1 %>% 
   html_nodes(xpath = '//div/div/div/a/div[not(div)]') %>% 
   html_text

输出：

#[1] "rstudio.com"        
#[2] "rstudio.cloud"           
#[3] "en.wikipedia.org › wiki › RStudio"    
# ....

使用 rvest 对 Google 搜索结果进行网络抓取时出现字符 (0) 错误

Character(0) error when using rvest to webscrape Google search results

r

google-search

web-scraping

rvest