使用 rvest 对 Google 搜索结果进行网络抓取时出现字符 (0) 错误
Character(0) error when using rvest to webscrape Google search results
我正在尝试抓取 Google 搜索的 headers。但是,无论我用 rvest
尝试什么,结果总是 returns character(0)
.
这是搜索代码 rstudio
:
library(rvest)
library(dplyr)
web1 <- read_html("https://www.google.at/search?q=rstudio")
header <-web1 %>%
html_nodes(".DKV0Md") %>%
html_text()
header
我在 SelectorGadget
中签入的节点名称,所以这应该不是问题。我该如何解决这个问题?
也许,我们可以使用:
library(rvest)
library(dplyr)
web1 %>%
html_nodes(xpath = '//div/div/div/a/div[not(div)]') %>%
html_text
输出:
#[1] "rstudio.com"
#[2] "rstudio.cloud"
#[3] "en.wikipedia.org › wiki › RStudio"
# ....
我正在尝试抓取 Google 搜索的 headers。但是,无论我用 rvest
尝试什么,结果总是 returns character(0)
.
这是搜索代码 rstudio
:
library(rvest)
library(dplyr)
web1 <- read_html("https://www.google.at/search?q=rstudio")
header <-web1 %>%
html_nodes(".DKV0Md") %>%
html_text()
header
我在 SelectorGadget
中签入的节点名称,所以这应该不是问题。我该如何解决这个问题?
也许,我们可以使用:
library(rvest)
library(dplyr)
web1 %>%
html_nodes(xpath = '//div/div/div/a/div[not(div)]') %>%
html_text
输出:
#[1] "rstudio.com"
#[2] "rstudio.cloud"
#[3] "en.wikipedia.org › wiki › RStudio"
# ....