使用 scikit learn 聚类逻辑回归模型

Clustering logistic regression models using sci-kit learn

我有一堆逻辑回归模型,我想看看它们的聚类效果如何。有效地制作几个模型来代表整个团队。

但是,许多模型没有相同的参数。当可能并非所有模型都具有所有参数时,聚集在 beta 上似乎很奇怪

我建议将每个解释变量的优势比的对数聚类。这样,对于没有某些回归量的模型,您可以使用 0.0 填充空值(使用 pandas

可以很容易地完成此操作

假设您有一个包含以下形式的所有模型的列表:

models = [{'beta1': m1_b1, 'beta2': m1_b2}, {'beta1': m2_b1, 'beta3': m2_b3}]

上面的命名法 m1_b1 表示模型 1,beta 1。您会注意到这两个没有相同的 beta。

您可以像这样将它们放入数据框中:

df = pd.DataFrame(models).fillna(0.0)