回归问题的分类数值变量为连续形式
Categorical numerical variable into continuous form for regression problem
我有一个数据集,其中所有列都是 numerical.Some,其中列的类别为数字形式,级别 >= 2。
我是否需要将该分类数值列转换为用于回归分析的因子?
请在 R 中提出任何更好的方法。
是的,你知道。你可以证明给自己看...
x <- rep(1:5, 20)
y <- rnorm(100)
# not converting to factors
m1 <- lm (y ~ x)
# converting to factors
m2 <- lm(y ~ as.factor(x) )
summary(m1) # one fitted coefficent
summary(m2) # five fitted coefficients
我有一个数据集,其中所有列都是 numerical.Some,其中列的类别为数字形式,级别 >= 2。 我是否需要将该分类数值列转换为用于回归分析的因子? 请在 R 中提出任何更好的方法。
是的,你知道。你可以证明给自己看...
x <- rep(1:5, 20)
y <- rnorm(100)
# not converting to factors
m1 <- lm (y ~ x)
# converting to factors
m2 <- lm(y ~ as.factor(x) )
summary(m1) # one fitted coefficent
summary(m2) # five fitted coefficients