是否可以在多输入神经网络中使用 sklearn 中的 StratifiedKFold？

Question

我有一个数据集，可以以 python 字典或 列表[= 的形式传递给多输入神经网络26=]:

例子:

#dict {'input1': X1, 'input2': X2, 'input3': X3}, {'output': Y} #list [ X1, X2, X3], y

现在我想使用 K 折交叉验证 来估计我的模型的性能。您认为我可以像在这个单输入示例中那样使用 sklearn 中的 StratifiedKFold 吗？

for train, test in kfold.split(X, Y): # create model model = Sequential() model.add(Dense(12, input_dim=8, activation='relu')) model.add(Dense(8, activation='relu')) model.add(Dense(1, activation='sigmoid')) # Compile model model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy']) # Fit the model model.fit(X[train], Y[train], epochs=150, batch_size=10, verbose=0) # evaluate the model scores = model.evaluate(X[test], Y[test], verbose=0) print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100)) cvscores.append(scores[1] * 100)

否则，最好的方法是什么？

Answer 1

skf.split() returns 你索引它只取决于 Y:

for train_index, test_index in skf.split(X, y):
...    print("TRAIN:", train_index, "TEST:", test_index)
...    X_train, X_test = X[train_index], X[test_index]
...    y_train, y_test = y[train_index], y[test_index]

因此您可以在此处传递任何 X 数组（即使是转换为数据帧或合成 X 的第 1 层的 X1）。然后你带着你的

train_index

和

test_index

并过滤所有输入。

同样，skf() 仅取决于您的 Y。所以目标是通过适当的 Y 并获得索引。

其他方式：将所有输入和输出合并到一个数据框中，并保留每一层的列名。在这种情况下，您有一个 'big' X。首先将其拆分为 train_index 和 test_index，然后使用您在上面保存的列名称将其拆分为 X1、X2 和 X3。

是否可以在多输入神经网络中使用 sklearn 中的 StratifiedKFold？

Is it possible to use StratifiedKFold from sklearn in multi input Neural Networks?

python

neural-network

scikit-learn

cross-validation

keras