Train/Test 在 R 中的 glmnet 包中 cv.glmnet 中设置比例

Train/Test Set Proportion in cv.glmnet from glmnet package in R

我只是想知道 cv.glmnet 中来自 R 中 glmnet 包的训练集和测试集的百分比是多少。我已经阅读了 glmnet 包文档,但没有包含有关 train/test 的信息定比例。如果我遗漏了包文档中的某些内容,请告诉我。任何帮助将不胜感激。谢谢。

?cv.glmnet 的帮助页面中有两个部分可供查看:

参数nfolds

number of folds - default is 10. Although nfolds can be as large as the sample size (leave-one-out CV), it is not recommended for large datasets. Smallest value allowable is nfolds=3

并且来自 Values 部分 foldid

if keep=TRUE, the fold assignments used

即。在函数参数中设置 keep=TRUE 以在之后访问折叠

该函数会将每一行放入 10 个大致相等的大小 groups/folds。然后它将 运行 模型的 10 次迭代,每次都会留下其中一次进行测试。所以它的 90% 训练和 10% 测试但重复了 10 次。

如果您愿意,可以使用 foldid 参数提供自己的折叠。希望有所帮助:)