使用 rvest 收集数据不会从数据小部件中检索任何值
Harvesting data with rvest retrieves no value from data-widget
我正在尝试使用 rvest
收集数据(也尝试使用 XML
和 selectr
)但我遇到了以下问题:
在我浏览器的网络检查器中,html 看起来像
<span data-widget="turboBinary_tradologic1_rate" class="widgetPlaceholder widgetRate rate-down">1226.45</span>
(注意:rate-down
和 1226.45
会定期更新。)我想收获 1226.45
但是当我 运行 我的代码(下面)时它说那里没有存储信息。这有什么关系吗
它是一个小部件的事实?如有任何关于如何进行的建议,我们将不胜感激。
library(rvest);library(selectr);library(XML)
zoom.turbo.url <- "https://www.zoomtrader.com/trade-now?game=turbo"
zoom.turbo <- read_html(zoom.turbo.url)
# Navigate to node
zoom.turbo <- zoom.turbo %>% html_nodes("span") %>% `[[`(90)
# No value
as.character(zoom.turbo)
html_text(zoom.turbo)
# Using XML and Selectr
doc <- htmlParse(zoom.turbo, asText = TRUE)
xmlValue(querySelector(doc, 'span'))
对于难以抓取的网站,例如内容是动态的,您可以使用 RSelenium
。使用此软件包和浏览器 docker,您可以使用 R 命令浏览网站。
我已经使用这种方法抓取了一个具有动态登录脚本的网站,但我无法使用其他方法。
我正在尝试使用 rvest
收集数据(也尝试使用 XML
和 selectr
)但我遇到了以下问题:
在我浏览器的网络检查器中,html 看起来像
<span data-widget="turboBinary_tradologic1_rate" class="widgetPlaceholder widgetRate rate-down">1226.45</span>
(注意:rate-down
和 1226.45
会定期更新。)我想收获 1226.45
但是当我 运行 我的代码(下面)时它说那里没有存储信息。这有什么关系吗
它是一个小部件的事实?如有任何关于如何进行的建议,我们将不胜感激。
library(rvest);library(selectr);library(XML)
zoom.turbo.url <- "https://www.zoomtrader.com/trade-now?game=turbo"
zoom.turbo <- read_html(zoom.turbo.url)
# Navigate to node
zoom.turbo <- zoom.turbo %>% html_nodes("span") %>% `[[`(90)
# No value
as.character(zoom.turbo)
html_text(zoom.turbo)
# Using XML and Selectr
doc <- htmlParse(zoom.turbo, asText = TRUE)
xmlValue(querySelector(doc, 'span'))
对于难以抓取的网站,例如内容是动态的,您可以使用 RSelenium
。使用此软件包和浏览器 docker,您可以使用 R 命令浏览网站。
我已经使用这种方法抓取了一个具有动态登录脚本的网站,但我无法使用其他方法。