您是否输入了错误的元素并且结果不匹配?
Did you enter the wrong element and the results do not match?
我正在抓取代码中的 url。
所有元素应该相同,
我有 33 条评论、135 颗星和 41 个约会。
我做错了什么?
我觉得33个应该是正常的。
我该如何解决?
#install.packages(c("rvest","httr"))
library(rvest)
library(httr)
all.reviews <- c()
all.stars <-c()
all.dates <-c()
for (page in 1:4){
url='https://www.amazon.com/ggplot2-Elegant-Graphics-Data-Analysis/product-reviews/0387981403/ref=cm_cr_arp_d_paging_btm_2?ie=UTF8&showViewpoints=1&sortBy=helpful&pageNumber='
url_page <- paste0(url,page)
reading_html <- read_html(url_page)
text_nodes <- html_nodes(reading_html, 'span.review-text')
review <- html_text(text_nodes)
all.reviews<-c(all.reviews, review)
text_date <- html_nodes(reading_html, 'span.review-date')
date <- html_text(text_date)
all.dates<-c(all.dates, date)
#span.a-icon-alt
text_star <- html_nodes(reading_html, 'span.a-icon-alt')
star <- html_text(text_star)
all.stars<-c(all.stars, star)
print(page)
}
原回答已被删除,以回应@hrbrmstr 提出的关于抓取亚马逊的担忧。
我正在抓取代码中的 url。
所有元素应该相同,
我有 33 条评论、135 颗星和 41 个约会。
我做错了什么?
我觉得33个应该是正常的。
我该如何解决?
#install.packages(c("rvest","httr"))
library(rvest)
library(httr)
all.reviews <- c()
all.stars <-c()
all.dates <-c()
for (page in 1:4){
url='https://www.amazon.com/ggplot2-Elegant-Graphics-Data-Analysis/product-reviews/0387981403/ref=cm_cr_arp_d_paging_btm_2?ie=UTF8&showViewpoints=1&sortBy=helpful&pageNumber='
url_page <- paste0(url,page)
reading_html <- read_html(url_page)
text_nodes <- html_nodes(reading_html, 'span.review-text')
review <- html_text(text_nodes)
all.reviews<-c(all.reviews, review)
text_date <- html_nodes(reading_html, 'span.review-date')
date <- html_text(text_date)
all.dates<-c(all.dates, date)
#span.a-icon-alt
text_star <- html_nodes(reading_html, 'span.a-icon-alt')
star <- html_text(text_star)
all.stars<-c(all.stars, star)
print(page)
}
原回答已被删除,以回应@hrbrmstr 提出的关于抓取亚马逊的担忧。