基于试验的数据集的 k 折交叉验证

k-fold cross validation for trial based data sets

我的EEG数据集包含一些受试者的数据,每个受试者有4个部分。
主要论文使用了以下方法:
它使用两个部分作为主题。第一部分用作训练数据,第二部分用作测试集。
我想用k-fold cross validation但是需要注意论文方法的条件(第1部分作为训练集,第2部分作为测试集)
首先,我需要将我的数据分成 k 部分,然后使用 k-1 部分作为训练,另外 1 部分作为测试,并在 k 循环中执行此过程。 我的数据分为两个独立的部分,如何在一个部分中看到两个部分?是否可以混合数据? 如果我混合它们,我应该如何使用纸张的条件? 提前致谢。

首先你的问题很含糊!而且你没有解释条件是什么或应该是什么。
无论如何,在 K-Fold 中,您的数据被统一划分为 k 个大小相等的子样本。在这 k 个子样本中,每次分离一个子样本并用作您的验证集,其余的用作您的训练集。这个过程重复 k 次(折叠),直到所有的分区只被用作验证一次。然后可以对来自折叠的 k 个结果进行平均以生成单个估计。

我不太明白你所说的主题是什么意思,但如果论文分别使用第 1 部分和第 2 部分进行训练和测试(验证),你可以执行以下任一操作:

  1. 您可以合并这两个部分,然后在这个新合并的数据集上应用 K-fold。
  2. 搁置测试数据(第二部分),运行 第一部分的 k 折,因此您的训练将有 k-1 折,验证有 1 折 你用它来 finding/fine 调整你的 parameters/network/model, 和一个最终用于测试的测试集