将 HTML 代码读入 R 以进行数据和文本挖掘

Read HTML code into R for data & text mining

我正在尝试将位于此站点上的信息读入 R 以进行数据和文本分析:

http://www.nhl.com/scores/htmlreports/20142015/PL020916.HTM

我尝试使用以下包和代码将源代码读入 R:

library(XML)
theurl <- "http://www.nhl.com/scores/htmlreports/20142015/PL020916.HTM"
tables <- readHTMLTable(theurl)

con = url("http://www.nhl.com/scores/htmlreports/20142015/PL020916.HTM")
htmlCode=readLines(con)
close(con)
htmlCode

我正在寻找一个输出,它是所提供信息的平面文件。

我不确定您要从您提供的页面中查找什么信息,但您可以通过以下方式使用 rvest 阅读它...

url <- "http://www.nhl.com/scores/htmlreports/20142015/PL020916.HTM"
library("rvest")
url %>% html()