如何将年龄分类为分类变量?

How is age classified as a categorical variable?

O.K 这个问题很基础,但是我不会,所以需要你的帮助。 我理解将年龄划分为类别的想法。 例如 :

我不明白模型怎么知道30<类别在31-45类别之前,为什么31-45类别在46-60类别之前等等模型怎么知道不这个图 -

谢谢!

考虑这个例子:

age = 1:100

fctr <- as.factor(cut(age, breaks = c(0,25,50,75,100)))

print(levels(fctr))

[1] "(0,25]"   "(25,50]"  "(50,75]"  "(75,100]"

在那里您可以看到级别是如何排序的。这是 plot 和 ggplot2 将使用的顺序。您可以通过以下方式更改此顺序:

fctr2 <- factor(fctr,levels(fctr)[c(2,1,3,4)])

print(levels(fctr2))

[1] "(25,50]"  "(0,25]"   "(50,75]"  "(75,100]"

如果您经常使用因子,请考虑使用 forcats 包。