为 R 中的非排除类别创建虚拟变量
Create dummy variables for non excluding categories in R
我想创建类别的二进制表示。我知道如何排除类别(使用 caret 包),但不是一种直接的方式来排除非排除类别。例如
movies <- data.table(movie=c( "batman", "bighero6"), type=list("action",c("action","animation")))
movie type
1: batman action
2: bighero6 action,animation
我想获得类似
action animation
batman 1 0
bighero6 1 1
我们可以使用dcast
dcast(movies[,.(type=unlist(type)) ,movie], movie~type, length)
我想创建类别的二进制表示。我知道如何排除类别(使用 caret 包),但不是一种直接的方式来排除非排除类别。例如
movies <- data.table(movie=c( "batman", "bighero6"), type=list("action",c("action","animation")))
movie type
1: batman action
2: bighero6 action,animation
我想获得类似
action animation
batman 1 0
bighero6 1 1
我们可以使用dcast
dcast(movies[,.(type=unlist(type)) ,movie], movie~type, length)