来自 sklearn 的 "transport" 训练模型的最佳实践

Question

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model


# Create linear regression object
regr = linear_model.LinearRegression()

# Train the model using the training sets
regr.fit(X_train, y_train)
# how save ?????
# save here

什么最佳实践可以保存训练模型并在其他地方使用？

Answer 1

sklearn 有一个 joblib 模块用于保存模型 and/or 保存到文件：

from sklearn.externals import joblib

joblib.dump(regr, 'file_name.pkl')

# load pickled model later
regr = joblib.load('file_name.pkl')

您也可以使用 Python 的内置函数 pickle，但是 docs 建议使用 joblib 来高效地 pickle 具有大型 numpy 数组的对象

来自 sklearn 的 "transport" 训练模型的最佳实践

Best practice to "transport" trained model from sklearn

python

machine-learning

python-2.7

sklearn-pandas