Python 逻辑回归中的多处理
multiprocessing in Logistic Regression in Python
我正在使用 LogisticRegression 算法
它工作正常,只是需要很长时间才能完成
我决定根据 https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html
使用多处理功能 (n_jobs=-1)
但性能没有变化
这是我的代码
mdl = LogisticRegression(n_jobs=-1)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
mdl.fit(X_train,y_train)
y_pred=mdl.predict(X_test)
如何在 LogisticRegression 上使用它?
你在做多类分类吗?
如果您的数据没有超过两个 类,设置 n_jobs
参数几乎没有用。
要提高速度,请尝试使用特征工程来减少特征数量。
您也可以尝试更改解算器。文档是这样说的:
"对于小型数据集,'liblinear'(曾经是
默认)是一个不错的选择,而“下垂”和
‘saga’ 对于大的来说更快。
对于多类问题,只有‘newton-cg’,
“sag”、“saga”和“lbfgs”处理多项式
失利; “liblinear”仅限于一对一
方案。"
还有一些参数,例如tol
您可以尝试更改。
最后,如果不行,换个型号吧。
我正在使用 LogisticRegression 算法
它工作正常,只是需要很长时间才能完成
我决定根据 https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html
使用多处理功能 (n_jobs=-1)但性能没有变化
这是我的代码
mdl = LogisticRegression(n_jobs=-1)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
mdl.fit(X_train,y_train)
y_pred=mdl.predict(X_test)
如何在 LogisticRegression 上使用它?
你在做多类分类吗?
如果您的数据没有超过两个 类,设置 n_jobs
参数几乎没有用。
要提高速度,请尝试使用特征工程来减少特征数量。
您也可以尝试更改解算器。文档是这样说的:
"对于小型数据集,'liblinear'(曾经是
默认)是一个不错的选择,而“下垂”和
‘saga’ 对于大的来说更快。
对于多类问题,只有‘newton-cg’,
“sag”、“saga”和“lbfgs”处理多项式
失利; “liblinear”仅限于一对一
方案。"
还有一些参数,例如tol
您可以尝试更改。
最后,如果不行,换个型号吧。