什么是机器学习中的 OOF 方法?

What is OOF approach in machine learning?

我在许多 kaggle notebook 中看到人们在使用 K-Fold 验证进行机器学习时谈论 oof 方法。什么是 oof,它与 k 折验证有关吗?你也可以建议一些有用的资源来详细了解这个概念

感谢您的帮助!

OOF 仅代表 "Out-of-fold",指的是使用 k 折验证时学习过程中的一个步骤,其中每组折的预测被组合到一组 1000 个预测中。这些预测现在是 "out-of-the-folds",因此可以根据这些预测计算误差,以很好地衡量您的模型有多好。

就更多地了解它而言,确实没有比这更多的了,而且它当然不是它自己的学习技巧或任何东西。如果你有一个小的跟进问题,请发表评论,我会尝试更新我的答案以包括这个。

编辑: 在网上闲逛时,我偶然发现了 this 来自 Cross-Validated 的相对相似的问题(答案稍微详细一些),也许它如果您仍然感到困惑,将添加一些直觉。

我发现 this article 从机器学习掌握中非常深入地解释折叠预测。 下面是文章的摘录,解释了折叠 (OOF) 预测是什么:

"折叠外预测是模型在 k 折交叉验证过程中的预测。 也就是说,折叠外预测是在重采样过程中对保留数据集所做的预测。如果正确执行,训练数据集中的每个示例都会有一个预测。"