回归问题的分类数值变量为连续形式

Categorical numerical variable into continuous form for regression problem

我有一个数据集,其中所有列都是 numerical.Some,其中列的类别为数字形式,级别 >= 2。 我是否需要将该分类数值列转换为用于回归分析的因子? 请在 R 中提出任何更好的方法。

是的,你知道。你可以证明给自己看...

x <- rep(1:5, 20)
y <- rnorm(100)

# not converting to factors
m1 <- lm (y ~ x)

# converting to factors
m2 <- lm(y ~ as.factor(x) )

summary(m1) # one fitted coefficent
summary(m2) # five fitted coefficients