K 折交叉验证/分区模型

K-fold cross validation / partitioned models

我有一个包含 41 个样本和 6 个预测变量的数据集。我在 Matlab 中使用 treebagger 作为分类树。尽管 oob 错误很高,但模型准确地预测了所有 41 个标签。

但后来我尝试使用k折交叉验证模型,验证准确率只有41%。我对此感到困惑。

我的另一个问题是,当我尝试交叉验证已构建的集成模型时,k 折算法 是如何工作的。任何帮助将非常感激。

您不能在同一数据上进行训练和测试。验证无意义。

K-fold cross-validation 就是为了防止这种情况发生。您训练一个子集并测试其余元素。冲洗并重复随机子集以提高验证准确性(而不是分类准确性)。

您不能使用 k-fold cross-validation 已经构建的分类器进行测试。那是没有意义的。