在 div#imgTagWrapperId 中获取 link 的 img
get link of img in div#imgTagWrapperId
我想在 R
中使用 rvest 将图像的 link 提取为字符串
我试过的是:
url <-"https://www.amazon.in/Livwell-Multipurpose-MultiColor-Polka-
Lunch/dp/B07LGTPM3D/ref=sr_1_1_sspa?ie=UTF8&qid=1548701326&sr=8-1-
spons&keywords=lunch+bag&psc=1"
webpage <- read_html(url)
imglink<-(webpage %>%
html_nodes("div#imgTagWrapperId") %>%
html_nodes("img") %>%
html_attr("src"))
我希望 imglink 的值为:https://images-na.ssl-images-amazon.com/images/I/51H-DAUxWzL.jpg
但是,它是一个非常长的字符类型对象,这不是我所需要的。
请帮忙?
您可以使用下面显示的 ID(和属性)或从脚本标签中提取(通过转换为 json 标签内的 javascript 对象)
require(rvest)
url <-"https://www.amazon.in/Livwell-Multipurpose-MultiColor-Polka-Lunch/dp/B07LGTPM3D/ref=sr_1_1_sspa?ie=UTF8&qid=1548701326&sr=8-1-spons&keywords=lunch+bag&psc=1"
webpage <- read_html(url)
r <- webpage %>%
html_nodes("#landingImage") %>%
html_attr("data-a-dynamic-image")
imglink <- strsplit(r, '"')[[1]][2]
print(imglink)
我想在 R
中使用 rvest 将图像的 link 提取为字符串我试过的是:
url <-"https://www.amazon.in/Livwell-Multipurpose-MultiColor-Polka-
Lunch/dp/B07LGTPM3D/ref=sr_1_1_sspa?ie=UTF8&qid=1548701326&sr=8-1-
spons&keywords=lunch+bag&psc=1"
webpage <- read_html(url)
imglink<-(webpage %>%
html_nodes("div#imgTagWrapperId") %>%
html_nodes("img") %>%
html_attr("src"))
我希望 imglink 的值为:https://images-na.ssl-images-amazon.com/images/I/51H-DAUxWzL.jpg
但是,它是一个非常长的字符类型对象,这不是我所需要的。 请帮忙?
您可以使用下面显示的 ID(和属性)或从脚本标签中提取(通过转换为 json 标签内的 javascript 对象)
require(rvest)
url <-"https://www.amazon.in/Livwell-Multipurpose-MultiColor-Polka-Lunch/dp/B07LGTPM3D/ref=sr_1_1_sspa?ie=UTF8&qid=1548701326&sr=8-1-spons&keywords=lunch+bag&psc=1"
webpage <- read_html(url)
r <- webpage %>%
html_nodes("#landingImage") %>%
html_attr("data-a-dynamic-image")
imglink <- strsplit(r, '"')[[1]][2]
print(imglink)