我可以在同一个 arff 文件中包含训练和测试数据吗?

Can I have training and test data in the same arff file?

我有一种算法可以一次接受一个文件。我需要它从训练集中学习规则并将其应用于测试集。因此,如果我在同一个文件中的训练集之后立即包含我的测试集,我这样做是否正确?

目前我有

@数据 ....训练集

@数据 ....测试集

我假设您使用 Weka,在这种情况下这不是 'right' 的方式。首先为训练数据创建一个 ARFF 文件。然后使用相同的数据结构(您在 ARFF 文件中定义的结构,它告知结构如何),创建一个测试 ARFF 文件。

在训练部分,Weka会要求你提供训练文件,然后你将有另一个选项提供测试数据,基本上提供给测试文件。这就是惯例。您可以将所有数据放在一个文件中,您应该也可以拆分它,但是您可能需要使用 Weka 源代码并且可能无法通过 Weka 的资源管理器来完成。