如何在 arff 文件中表示 n-gram 特征?

How to represent n-gram features in arff file?

我一直在网上搜索这个问题,但没有找到解决办法。 问题是: 我首先在 java 中使用 Weka API 来提取 n-gram 特征,其中一个我可以举例说明的是

"not good"

问题从这里开始: Header 的 arff 文件将是这样的:

@relation words
@attribute {0,1} not good

但是在创建arff文件后,当我要处理该文件时,出现异常,即arff文件的结构不正确。

属性名称和可能值的顺序不正确。此外,必须引用包含 space 的属性名称。应加载下面的示例 .arff 文件。

http://www.cs.waikato.ac.nz/ml/weka/arff.html

@relation words

@attribute 'not good' {0,1}

@data

0
1
0
1