将训练结果聚合到预测中

Aggregate training results to predits

训练模型时，结果取决于采样。为了获得更好的结果，您可以重复训练（在另一个随机创建的训练样本中，使用 Ffolds, StratifiedKFold ... ），以某种方式汇总结果并以这种方式获得比在单独的特殊情况。 问题：是否已经在 sklearn 或类似软件中实现了？。抱歉，这是一个直截了当的问题，我还没有看到一个简单的解决方案。

我看到有一个名为 cross_val_predict 的函数，但是我快速查看源代码的第一印象是它预测的次数与火车一样多，我只想预测一次，所以我可以选择，以某种方式汇总结果，并在以后进行预测，而不是再次重复整个训练过程。

到目前为止，我认为最好的选择是 ensemblers in sklearn。

我在这里留下了我之前使用的解决方案。我很确定可以改进（如 Ensemblers in sklearn) are better. I have placed here https://github.com/rafaelvalero/aggreating_predictions_sklearn 之前提到的那样，我在其中留下了一个笔记本和示例（使用 iris 数据库），以防任何人都可以尝试并详细了解如何完成。

该解决方案将训练模型（并行，使用 joblib），pickle 训练模型（来自 SKlearn 的模型），存储结果（使用 joblib 转储），然后恢复它们以创建预测（并行，使用joblib) 稍后聚合。

将训练结果聚合到预测中

Aggregate training results to predits

python-3.x

scikit-learn

cross-validation