cross_val_score 是连续抽样还是随机抽样?

Does cross_val_score take sequential samples or random samples?

在此: cross_val_score(GaussianNB(),特征,目标,cv=10)

我们是将数据随机分成 10 份还是按顺序进行?

这取决于您在 cv 参数中指定的内容。

如果自变量是二元或多类,则使用StratifiedKFold,否则使用KFold。您还可以通过指定一个函数(sklearn 或其他)来执行拆分来覆盖这些选项。

KFold 函数会将数据分成连续的折叠。如果你想让它随机拆分,你可以将 shuffle 参数设置为 True。如果你想修复随机洗牌,你可以为 random_state 设置一个值。如果你不这样做,它会取一个随机值,每次你运行函数时折叠都会不同。

对于 StratifiedKFold,它将拆分数据,同时尝试在每个拆分中保持因变量的 类 相同比率。因此,每次调用该函数时都会有细微的变化。即默认情况下它不会是顺序的。