创建 weka arff 文件时我应该如何处理未知数据
what should i do with unknown data while creating weka arff files
我正在尝试将我的数据集格式化为 weka arff 文件。这是我的 arff 文件的示例:
@relation my_relation
@attribute 'attrib_1' numeric
@attribute 'attrib_2' numeric
@attribute 'attrib_3' numeric
...
@attribute 'class' {1,2,3,4,5}
@data
6,6,55,0,0,0,18.9,0,1,2,'?',14,15,20,'?','?','?','?',28,29,1
54,25,19,4.85,0,1,10,13,'?','?','?','?','?','?',15,16,19,20,21,0,3
...
我的特征是数值和实数值,但在不同的情况下(实例)每个特征都有一些缺失值。我应该如何确定我的特征包含缺失值?
(我使用 '?' 表示缺失值,但在尝试打开 mydata.arff
时出现此错误
number expected, read token[?], line 746
)
编辑: 我更改了 '?'到 ?并尝试加载 file.this 时出现以下错误:
nominal value not declared in header, read Token[86], line 746
我正在尝试将我的数据集格式化为 weka arff 文件。这是我的 arff 文件的示例:
@relation my_relation
@attribute 'attrib_1' numeric
@attribute 'attrib_2' numeric
@attribute 'attrib_3' numeric
...
@attribute 'class' {1,2,3,4,5}
@data
6,6,55,0,0,0,18.9,0,1,2,'?',14,15,20,'?','?','?','?',28,29,1
54,25,19,4.85,0,1,10,13,'?','?','?','?','?','?',15,16,19,20,21,0,3
...
我的特征是数值和实数值,但在不同的情况下(实例)每个特征都有一些缺失值。我应该如何确定我的特征包含缺失值? (我使用 '?' 表示缺失值,但在尝试打开 mydata.arff
时出现此错误number expected, read token[?], line 746
) 编辑: 我更改了 '?'到 ?并尝试加载 file.this 时出现以下错误:
nominal value not declared in header, read Token[86], line 746