R 插入符号 "besttune" 用于 CV 和 repeatedCV

R caret "besttune" for CV & repeatedCV

我试图了解 caret 是如何做出最佳调整模型的决定的。我查看了文档,但没有找到(这很可能是我的错)调整的地方这个决定是如何做出的。我使用的是类似于:

train(
    y~.,
    data=X,
    num.trees = 1000,
    method = "ranger",
    trControl = trainControl(
   method = "repeatedcv",
   number = 100,
   repeats = 100, verboseIter = T
 )

我正在尝试更频繁地使用插入符号,而且我确信它可以通过一种聪明的方式做出决定。我只是想了解如何以及是否可以调整它。

有很多文档,但查找问题的最佳位置是 here

基本上,对于网格搜索,调整参数的多个组合是使用重采样来评估的。每个组合都会得到一个相关的 重采样 性能估计(假设它是准确度)。

train() 知道精度应该最大化,因此默认情况下,它会选择具有最大值的参数组合并使用它们来拟合一个最终模型(使用这些值和整个训练集)。