将训练结果聚合到预测中

Aggregate training results to predits

训练模型时,结果取决于采样。为了获得更好的结果,您可以重复训练(在另一个随机创建的训练样本中,使用 Ffolds, StratifiedKFold ... ),以某种方式汇总结果并以这种方式获得比在单独的特殊情况。 问题:是否已经在 sklearn 或类似软件中实现了?。抱歉,这是一个直截了当的问题,我还没有看到一个简单的解决方案。

我看到有一个名为 cross_val_predict 的函数,但是我快速查看源代码的第一印象是它预测的次数与火车一样多,我只想预测一次,所以我可以选择,以某种方式汇总结果,并在以后进行预测,而不是再次重复整个训练过程。

到目前为止,我认为最好的选择是 ensemblers in sklearn

我在这里留下了我之前使用的解决方案。我很确定可以改进(如 Ensemblers in sklearn) are better. I have placed here https://github.com/rafaelvalero/aggreating_predictions_sklearn 之前提到的那样,我在其中留下了一个笔记本和示例(使用 iris 数据库),以防任何人都可以尝试并详细了解如何完成。

该解决方案将训练模型(并行,使用 joblib),pickle 训练模型(来自 SKlearn 的模型),存储结果(使用 joblib 转储),然后恢复它们以创建预测(并行,使用joblib) 稍后聚合。