如何将数值变量重新编码为分类变量?
How to recode numerical variable into categorical?
您好,我一直在尝试将数值变量重新编码为分类变量。
例如,使用 mtcars
,我试图将 mpg
分成 2 个类别 < 25 & =>25
这些是我试过的代码,但收到错误消息。
data=mtcars
summary(mtcars$mpg)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
mpgcat <- cut(mpg, breaks = (0,24.99,34), labels = c("0","1"))
Error: unexpected ',' in "mpgcat <- cut(mpg, breaks = (0,"
cut
将x
的范围划分为区间,并根据它们落在哪个区间对x中的值进行编码。最左边的区间对应一级,下一个最左边的区间对应二级,依此类推。
breaks 是两个或多个唯一切割点的数值向量,或者是单个数字(大于或等于 2),给出 x
待删
因此您需要一些脚本代码,例如:
data=mtcars
summary(mtcars$mpg)
mpgcut <- cut(mtcars$mpg, breaks = c(0,24.99,34), labels = c("0","1"))
mpgcut
得到这样的结果:
[1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 0 0
Levels: 0 1
您好,我一直在尝试将数值变量重新编码为分类变量。
例如,使用 mtcars
,我试图将 mpg
分成 2 个类别 < 25 & =>25
这些是我试过的代码,但收到错误消息。
data=mtcars
summary(mtcars$mpg)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
mpgcat <- cut(mpg, breaks = (0,24.99,34), labels = c("0","1"))
Error: unexpected ',' in "mpgcat <- cut(mpg, breaks = (0,"
cut
将x
的范围划分为区间,并根据它们落在哪个区间对x中的值进行编码。最左边的区间对应一级,下一个最左边的区间对应二级,依此类推。
breaks 是两个或多个唯一切割点的数值向量,或者是单个数字(大于或等于 2),给出 x
待删
因此您需要一些脚本代码,例如:
data=mtcars
summary(mtcars$mpg)
mpgcut <- cut(mtcars$mpg, breaks = c(0,24.99,34), labels = c("0","1"))
mpgcut
得到这样的结果:
[1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 0 0
Levels: 0 1