R rvest 连接到本地主机

R rvest connect with local host

我正在创建一种将 SPSS 标签读入 R 的方法。使用 library(sjPlot),view_spss(df, useViewer = FALSE) 我可以创建一个本地 html 页面,例如 http://localhost:11773/session/file1e0c67270a5.html 显示了一个很好的 table,其中包含变量名称和我正在寻找的标签的列。

现在我想使用 rvest 来抓取它,但是当我开始使用诸如 page <- rvest::html("http://localhost:11773/session/file1e0c67270a5.html") R 之类的命令时,R 似乎卡住了。

我尝试搜索 "connect with local host",但似乎找不到与 R 包相关的任何问题或答案。

这并没有真正回答您的具体问题,因为我认为原因是 R 启动了一个非持久性进程来为您的数据的 HTML 视图提供服务。但是您的方法似乎只是为了获取变量标签。这是一种非常有效的通用方法:

library(foreign)
d <- read.spss("your_data.sav", use.value.labels=TRUE, to.data.frame=FALSE)
var_labels <- attr(d, "variable.labels")

##  To access the label of a variable named 'var_name':
var_labels[["var_name"]]

其中 d 生成数据列表,var_labels 是由 variable/column 键控的命名标签列表。

如果想获取SPSS导入数据的变量and/or值标签,可以使用sjmisc-package.[=14=的get_val_labelsget_var_labels ]

查看示例 here. Both functions accept either a single variable (vector) or a data frame and return the associated variable and value labels. See also this blog post

sjmisc-Package 支持使用 haven- 或 foreign-package 导入的数据帧。