如何将年龄分类为分类变量?
How is age classified as a categorical variable?
O.K 这个问题很基础,但是我不会,所以需要你的帮助。
我理解将年龄划分为类别的想法。
例如 :
我不明白模型怎么知道30<类别在31-45类别之前,为什么31-45类别在46-60类别之前等等模型怎么知道不这个图 -
谢谢!
考虑这个例子:
age = 1:100
fctr <- as.factor(cut(age, breaks = c(0,25,50,75,100)))
print(levels(fctr))
[1] "(0,25]" "(25,50]" "(50,75]" "(75,100]"
在那里您可以看到级别是如何排序的。这是 plot 和 ggplot2 将使用的顺序。您可以通过以下方式更改此顺序:
fctr2 <- factor(fctr,levels(fctr)[c(2,1,3,4)])
print(levels(fctr2))
[1] "(25,50]" "(0,25]" "(50,75]" "(75,100]"
如果您经常使用因子,请考虑使用 forcats 包。
O.K 这个问题很基础,但是我不会,所以需要你的帮助。
我理解将年龄划分为类别的想法。
例如 :
我不明白模型怎么知道30<类别在31-45类别之前,为什么31-45类别在46-60类别之前等等模型怎么知道不这个图 -
谢谢!
考虑这个例子:
age = 1:100
fctr <- as.factor(cut(age, breaks = c(0,25,50,75,100)))
print(levels(fctr))
[1] "(0,25]" "(25,50]" "(50,75]" "(75,100]"
在那里您可以看到级别是如何排序的。这是 plot 和 ggplot2 将使用的顺序。您可以通过以下方式更改此顺序:
fctr2 <- factor(fctr,levels(fctr)[c(2,1,3,4)])
print(levels(fctr2))
[1] "(25,50]" "(0,25]" "(50,75]" "(75,100]"
如果您经常使用因子,请考虑使用 forcats 包。