Python 逻辑回归中的多处理

multiprocessing in Logistic Regression in Python

我正在使用 LogisticRegression 算法

它工作正常,只是需要很长时间才能完成

我决定根据 https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html

使用多处理功能 (n_jobs=-1)

但性能没有变化

这是我的代码

mdl = LogisticRegression(n_jobs=-1)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
mdl.fit(X_train,y_train)
y_pred=mdl.predict(X_test)

如何在 LogisticRegression 上使用它?

你在做多类分类吗? 如果您的数据没有超过两个 类,设置 n_jobs 参数几乎没有用。

要提高速度,请尝试使用特征工程来减少特征数量。

您也可以尝试更改解算器。文档是这样说的:
"对于小型数据集,'liblinear'(曾经是 默认)是一个不错的选择,而“下垂”和 ‘saga’ 对于大的来说更快。 对于多类问题,只有‘newton-cg’, “sag”、“saga”和“lbfgs”处理多项式 失利; “liblinear”仅限于一对一 方案。"

还有一些参数,例如tol您可以尝试更改。

最后,如果不行,换个型号吧。