使用 SKlearn 的 LogisticRegression 为多项式 Logit 中的结果变量指定参考类别

Specifying Reference Category for Outcome Variable in Multinomial Logit Using SKlearn's LogisticRegression

我正在尝试使用 Sklearn 的 LogisticRegression 模块来拟合多项式 logit 模型。

我的结果 (y) 有 4 个级别。我需要将这些级别之一指定为参考类别(或基线)。 LogisticRegression 模块是否提供了指定此参考类别的方法?

sklearn 中多个 classes 的 LogisticRegression 使用问题的 one vs all 或 softmax 参数化,具体取决于您是否指定多项式。在任何一种情况下,它都不会使用参考来计算解决方案,而是为每个输出 class 计算系数向量。如果您使用多项式规范,您可以 select 对应于您要设置的参考类别的系数,并从其他系数中减去该系数,这应该会恢复您似乎想要的等效解决方案。

有关如何指定多项式的信息,请参阅文档:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html