多次拟合 sklearn 线性回归分类器是添加数据点还是只是替换它们？

Question

X = np.array(df.drop([label], 1))
X_lately = X[-forecast_out:]
X = X[:-forecast_out]
df.dropna(inplace=True)
y = np.array(df[label])

X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.2)

linReg.fit(X_train, y_train)

我一直在用来自不同电子表格的数据一遍又一遍地拟合我的线性回归分类器，假设每次我用一个新的电子表格拟合同一个模型，它都会添加点并使模型更健壮。

这个假设是否正确？还是我每次试穿都只是擦模型？

如果是这样，有没有办法让我多次拟合我的模型以获得这种 'cumulative' 类型的效果？

Answer 1

您几乎可以肯定是从头开始擦除您的模式。要执行您想要的操作，您需要将附加数据附加到数据框的底部并使用它重新调整。

Answer 2

线性回归是一种批处理（又名离线）训练方法，您无法使用新模式添加知识。所以，sklearn 正在重新拟合整个模型。添加数据的唯一方法是将新模式附加到原始训练 X, Y 矩阵并重新拟合。

多次拟合 sklearn 线性回归分类器是添加数据点还是只是替换它们？

Does fitting a sklearn Linear Regression classifier multiple times add data points or just replace them?

python

regression

scikit-learn