Weka 中具有不平衡数据集的属性评估器
Attribute evaluator with unbalanced dataset in Weka
我有一个不平衡的数据集。所以我在使用 classifier 时性能很差。这是一个二进制 class 问题,我使用 Random forest
作为 class 运算符。 True negative
与 True positive
之比为 7:1。所以我试图解决这个问题并使用 Subset Evaluator
和 Random Forest
并使用 BestFirst search
找出重要的属性。然后我只使用数据集中的重要属性和 class 属性并丢弃所有其他属性。然后我再次对数据集执行 Random Forest
。现在它的性能更差。 True negative
和 true positive
的比例就像 12:1。我在整个过程中使用 Weka。
我想知道属性评估器是否适用于不平衡数据集?
谢谢。
如果属性子集与大多数 class 标签高度相关,那么这会加剧不平衡也就不足为奇了。毕竟,您正在删除与少数 class 标签相关的属性。
我有一个不平衡的数据集。所以我在使用 classifier 时性能很差。这是一个二进制 class 问题,我使用 Random forest
作为 class 运算符。 True negative
与 True positive
之比为 7:1。所以我试图解决这个问题并使用 Subset Evaluator
和 Random Forest
并使用 BestFirst search
找出重要的属性。然后我只使用数据集中的重要属性和 class 属性并丢弃所有其他属性。然后我再次对数据集执行 Random Forest
。现在它的性能更差。 True negative
和 true positive
的比例就像 12:1。我在整个过程中使用 Weka。
我想知道属性评估器是否适用于不平衡数据集?
谢谢。
如果属性子集与大多数 class 标签高度相关,那么这会加剧不平衡也就不足为奇了。毕竟,您正在删除与少数 class 标签相关的属性。