r expss 重新编码因子

r expss recoding factor

我想使用以下示例对因子变量进行小的重新编码:https://cran.r-project.org/web/packages/expss/vignettes/tables-with-labels.html

a<-c(1,2,1,3,5,4,1,3,2,2,1,1)
a<-factor(a,levels = c(1,2,3,4,5), labels = c("aa", "bb", "cc", "dd", "ee" ))

假设我想创建新变量 b,其中“aa”、“bb”、“cc”现在是“xx”,其余的将被复制。 看来我不能参考数字:

b<-expss::recode(a,1:3~99)

因为这个 return 没什么。所以我试着通过标签来引用:

b<-expss::recode(a, c("aa", "bb", "cc")~"xx", TRUE~copy, with_labels=FALSE)

但在这种情况下,新变量仍然存储了旧级别:

$levels
[1] "aa" "bb" "cc" "dd" "ee" "xx"

$class
[1] "factor"

那么仅使用“xx”、“dd”、“ee”级别获取新变量的正确方法应该是什么?

我们可以用 droplevels 换行以删除那些未使用的级别

b <- droplevels(expss::recode(a, c("aa", "bb", "cc")~"xx",
        TRUE~copy, with_labels=FALSE))
levels(b)
#[1] "dd" "ee" "xx"