WEKA投票算法分类与概率不一致?
WEKA voting algorithm classifications are inconsistent with probabilities?
我的问题是 WEKA Vote 命令使用平均概率和以下分类器:
java -classpath weka.jar -Xmx1G weka.classifiers.meta.Vote -S 1 -p 0 -distribution -t train.arff -T test.arff -B "weka.classifiers.functions.SMO -C 1.0 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -M -K \"weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 1.0\"" -B "weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a" -B "weka.classifiers.trees.J48 -C 0.25 -M 2" -R AVG
Weka 结果输出:
inst# actual predicted error distribution
1 1:? 1:active *0.311,0.689
2 1:? 1:active *0.807,0.193
3 1:? 1:active *0.187,0.813
我有点困惑为什么实例 1 和实例 3 被分类为 "active",而根据分布 "inactive" 具有更高的概率。
例如,如果第 1 行是一致的,我想它的结果会是这样的:
1 1:? 2:inactive 0.311,*0.689
任何解释或指导将不胜感激。
事实证明,解决方案是升级我的 WEKA 版本。我之前使用的是 3.5.6 版,升级到 3.7.2 版对我有用。
我现在收到的结果符合预期:
inst# actual predicted error distribution
1 1:? 2:inactive 0.311,*0.689
2 1:? 1:active *0.807,0.193
3 1:? 2:inactive 0.187,*0.813
我的问题是 WEKA Vote 命令使用平均概率和以下分类器:
java -classpath weka.jar -Xmx1G weka.classifiers.meta.Vote -S 1 -p 0 -distribution -t train.arff -T test.arff -B "weka.classifiers.functions.SMO -C 1.0 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -M -K \"weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 1.0\"" -B "weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a" -B "weka.classifiers.trees.J48 -C 0.25 -M 2" -R AVG
Weka 结果输出:
inst# actual predicted error distribution
1 1:? 1:active *0.311,0.689
2 1:? 1:active *0.807,0.193
3 1:? 1:active *0.187,0.813
我有点困惑为什么实例 1 和实例 3 被分类为 "active",而根据分布 "inactive" 具有更高的概率。
例如,如果第 1 行是一致的,我想它的结果会是这样的:
1 1:? 2:inactive 0.311,*0.689
任何解释或指导将不胜感激。
事实证明,解决方案是升级我的 WEKA 版本。我之前使用的是 3.5.6 版,升级到 3.7.2 版对我有用。
我现在收到的结果符合预期:
inst# actual predicted error distribution
1 1:? 2:inactive 0.311,*0.689
2 1:? 1:active *0.807,0.193
3 1:? 2:inactive 0.187,*0.813