使用脑电图 (EEG) 数据进行深度学习
Deeplearning with electroencephalography (EEG) data
我正在制作一个卷积网络模型,我想用它对 EEG 数据进行分类。数据是一个实验,其中参与者被 3 个不同 类 的图像唤起,每个图像有 2 个 sub类。为了简要说明数据集的大小,一个子类具有给定参与者的 ±300 个时期(这适用于所有子类)。
- 对象
- 颜色
- 人数
现在我的问题是:
我的训练数据集中有 5 个参与者,我将每个参与者数据的 15% 放入测试数据集中。我可以将 15% 视为看不见的数据,即使使用同一参与者来训练模型吗?
欢迎任何意见!
这取决于你想测试什么。测试集用于估计泛化(即未见数据的性能)。所以问题是:
- 是否要估计对来自相同参与者(其数据用于训练分类器)的未见数据的泛化?
- 或者你想估计对看不见的参与者(一般人群)的泛化?
这实际上取决于您的目标或您要提出的主张。我可以想到两种方法的情况:
- 想想需要为每个用户重新训练的 BCI。在这里,您将测试来自同一个人的数据。
- 另一方面,如果您提出一个非常笼统的主张(例如,我可以解码来自人群中某个大脑区域的一些相关信号),那么有一个由未包含在训练集中的参与者组成的测试集将为您的主张提供更有力的支持。 (不过,问题是这是否有效。)
我正在制作一个卷积网络模型,我想用它对 EEG 数据进行分类。数据是一个实验,其中参与者被 3 个不同 类 的图像唤起,每个图像有 2 个 sub类。为了简要说明数据集的大小,一个子类具有给定参与者的 ±300 个时期(这适用于所有子类)。
- 对象
- 颜色
- 人数
现在我的问题是: 我的训练数据集中有 5 个参与者,我将每个参与者数据的 15% 放入测试数据集中。我可以将 15% 视为看不见的数据,即使使用同一参与者来训练模型吗?
欢迎任何意见!
这取决于你想测试什么。测试集用于估计泛化(即未见数据的性能)。所以问题是:
- 是否要估计对来自相同参与者(其数据用于训练分类器)的未见数据的泛化?
- 或者你想估计对看不见的参与者(一般人群)的泛化?
这实际上取决于您的目标或您要提出的主张。我可以想到两种方法的情况:
- 想想需要为每个用户重新训练的 BCI。在这里,您将测试来自同一个人的数据。
- 另一方面,如果您提出一个非常笼统的主张(例如,我可以解码来自人群中某个大脑区域的一些相关信号),那么有一个由未包含在训练集中的参与者组成的测试集将为您的主张提供更有力的支持。 (不过,问题是这是否有效。)