从标记数据创建带有标签的列

Create column with labels from labelled data

我有一个带有标签数据的数据集,我想创建一个仅包含标签作为字符的新列。

考虑以下示例:

value_labels <- tibble(value = 1:6, labels = paste0("value", 1:6))
df_data <- tibble(id = 1:10, var = floor(runif(10, 1, 6)))
df_data <- df_data %>% mutate(var = haven::labelled(var, labels = deframe(value_labels[2:1])))

这产生:

# A tibble: 10 x 2
      id        var
   <int>  <dbl+lbl>
 1     1 2 [value2]
 2     2 2 [value2]
 3     3 4 [value4]
 4     4 2 [value2]
 5     5 4 [value4]
 6     6 3 [value3]
 7     7 5 [value5]
 8     8 4 [value4]
 9     9 3 [value3]
10    10 1 [value1]

我现在想创建一个仅包含标签的附加列 labs(即第 1 行和第 2 行中的 value2,第 3 行中的 value4

我尝试使用 val_labs() (df_data %>% mutate(labs = val_labels(df_data$var, var))) 失败。有人可以指出正确的方法吗?

haven::as_factor() 用于此。请参阅 help page 的标记向量示例。

df_data %>%
  mutate(labs = as_factor(var))

# A tibble: 10 × 3
      id        var  labs 
   <int>  <dbl+lbl> <fct> 
 1     1 2 [value2] value2
 2     2 5 [value5] value5
 3     3 2 [value2] value2
 4     4 5 [value5] value5
 5     5 2 [value2] value2
 6     6 4 [value4] value4
 7     7 5 [value5] value5
 8     8 4 [value4] value4
 9     9 5 [value5] value5
10    10 3 [value3] value3

我们可以使用get_labels

library(dplyr)
library(sjlabelled)
df_data %>% 
   mutate(labs = get_labels(var)[var])

-输出

# A tibble: 10 × 3
      id        var labs  
   <int>  <dbl+lbl> <chr> 
 1     1 3 [value3] value3
 2     2 3 [value3] value3
 3     3 2 [value2] value2
 4     4 4 [value4] value4
 5     5 5 [value5] value5
 6     6 3 [value3] value3
 7     7 3 [value3] value3
 8     8 4 [value4] value4
 9     9 1 [value1] value1
10    10 2 [value2] value2