如何处理 Weka 分类问题中的未知类别?

How to handle unknown category in classification problems for Weka?

我必须 运行 Weka 中的 J48 决策树算法来根据花的类型属性对一些花进行分类。在我做任何事情之前,我必须清理我的数据,但是我观察到我的 Type 属性具有以下值:

Type table example

我应该删除标签未知的数据吗?

我首先做的是 运行 我的分类器包含所有脏数据,我得到了 ~89% 的准确度和 0.85 的 F-Measure。

清理数据(保留未知数)后,模型的准确性下降了。如果我忽略所有带有未知标签的数据,我的准确性会大大提高。

在这种情况下,您有什么看法,我该怎么办? 非常感谢帮助

你应该删除未知的。通常,这意味着您尝试预测的属性没有编码,因此您正在添加噪声。

获得模型后,使用模型预测未知数。