rvest 不适合这种抓取功能
rvest not suitable for this scraping functionality
我正在尝试使用 R 网络抓取此网页的标题内容,但 rvest
并不是完成这项工作的好工具。
我的代码:
url <-"https://letterboxd.com/crew/list/most-fans-on-letterboxd-with-pronoun-she/"
title <- read_html(url) %>%
html_nodes("span .frame-title") %>% # selector
html_text()
这应该给我与给定节点关联的标题(使用示例:电影 Her (2013))...
<span class="frame-title" data-reactid=".c.3.1">Her (2013)</span>
...但是我每次和每个插槽都得到空白(“”)输出。
我正在考虑 RCurl
包一些东西,但我不知道它是否真的有助于我提取节点的情况。我需要该部门的一些帮助,以便为该网页获取 "frame-title" 下的标题。任何帮助将不胜感激。
该网站的页面源代码与您发布的内容不同。下面应该修复它:
read_html(url) %>%
html_nodes("img") %>%
html_attr("alt")
我正在尝试使用 R 网络抓取此网页的标题内容,但 rvest
并不是完成这项工作的好工具。
我的代码:
url <-"https://letterboxd.com/crew/list/most-fans-on-letterboxd-with-pronoun-she/"
title <- read_html(url) %>%
html_nodes("span .frame-title") %>% # selector
html_text()
这应该给我与给定节点关联的标题(使用示例:电影 Her (2013))...
<span class="frame-title" data-reactid=".c.3.1">Her (2013)</span>
...但是我每次和每个插槽都得到空白(“”)输出。
我正在考虑 RCurl
包一些东西,但我不知道它是否真的有助于我提取节点的情况。我需要该部门的一些帮助,以便为该网页获取 "frame-title" 下的标题。任何帮助将不胜感激。
该网站的页面源代码与您发布的内容不同。下面应该修复它:
read_html(url) %>%
html_nodes("img") %>%
html_attr("alt")