Python 带有分类标签的 OLS

Python OLS with categorical label

我有一个数据集,我试图根据许多特征来预测汽车的类型。我想进行 OLS 回归以查看

import statsmodels.api as sm

X  = features 
# where 0 = sedan, 1 = minivan , etc 
y = [0,0,1,0,2,....]

X2 = sm.add_constant(np.array(X))
est = sm.OLS(np.array(y), X2)
est2 = est.fit()

^ 我觉得这样做不正确,因为我没有指定它是绝对的,我觉得函数形式应该改变。想知道是否有人对此有任何见解。

普通最小二乘法回归假设一个数值因变量,您不能用它来预测分类结果。

要使用回归模型预测 分类 结果,您需要使用 多项逻辑回归 ,例如使用 sklearn .