StratifiedKFold 输出处理

StratifiedKFold output handling

我有一个 20 行 60 列的系列,即 20 个示例,每个示例有 60 个参数。

kfold = StratifiedKFold(y=encoded_Y, n_folds=10, shuffle=True, random_state=seed) The output consists of two columns

我想知道第二列是什么意思,它是根据什么来选择这两个索引的。为什么不取三个索引?

此外,我想知道交叉验证函数如何将这个系列作为 "cv" 参数的输入。 "cv"一般为整数。

results = cross_val_score(estimator, X, encoded_Y, cv=kfold)

sklearn.cross_validation 中的所有交叉验证器一样,这是索引对上的迭代器。在每一对中,第一项是训练索引列表,第二项是测试索引列表。

the example you bring 中,第一项包含一对,其中除 1、17 之外的所有内容都是训练索引,而 1、17 是测试索引。