Weka 中具有不平衡数据集的属性评估器

Attribute evaluator with unbalanced dataset in Weka

我有一个不平衡的数据集。所以我在使用 classifier 时性能很差。这是一个二进制 class 问题,我使用 Random forest 作为 class 运算符。 True negativeTrue positive 之比为 7:1。所以我试图解决这个问题并使用 Subset EvaluatorRandom Forest 并使用 BestFirst search 找出重要的属性。然后我只使用数据集中的重要属性和 class 属性并丢弃所有其他属性。然后我再次对数据集执行 Random Forest 。现在它的性能更差。 True negativetrue positive 的比例就像 12:1。我在整个过程中使用 Weka。

我想知道属性评估器是否适用于不平衡数据集?

谢谢。

如果属性子集与大多数 class 标签高度相关,那么这会加剧不平衡也就不足为奇了。毕竟,您正在删除与少数 class 标签相关的属性。