Weka的直方图解释

Histogram interpretation of Weka

我对Weka的数据解释有疑问。我处理的数据集如下

outlook  temperature    humidity    windy   play
------------------------------------------------------
sunny    hot            high        FALSE   no
sunny    hot            high        TRUE    no
overcast hot            high        FALSE   yes
rainy    mild           high        FALSE   yes
rainy    cool           normal      FALSE   yes
rainy    cool           normal      TRUE    no
overcast cool           normal      TRUE    yes
sunny    mild           high        FALSE   no
sunny    cool           normal      FALSE   yes
rainy    mild           normal      FALSE   yes
sunny    mild           normal      TRUE    yes
overcast mild           high        TRUE    yes
overcast hot            normal      FALSE   yes
rainy    mild           high        TRUE    no

根据上述数据集在Weka中生成的直方图,这些直方图对我来说不是很清楚。

我知道蓝色代表可以玩,红色代表不能玩。要绘制直方图,我们需要找出数据的频率。

在上图中,晴天数为 5,因为根据以上数据集,outlook 属性有 5 个值是晴天。在上图中,阴天数为 4,因为根据上述数据集,outlook 属性有 4 个阴天数。阴天可以玩,没有阴天不能玩的选项。所以阴条是纯蓝色的。但是,如果前景晴朗,则有 3 种可能性可以玩,2 种可能性不能玩。因此,sunny 酒吧是蓝色和红色的混合。

现在,如果前景晴朗,我怎么能只看条形图就知道有多少实例是肯定的,如果前景晴朗,有多少实例不是?

另外,在excel中如何绘制这样的直方图?

谢谢。

Weka 资源管理器中的 bar-plot(标称 class)或直方图(数字 class)只是为了让您了解数据。在撰写本文时,除了显示在顶部的总数之外,无法从图表中区分相关 class 标签的各种计数。

我不使用 Excel,所以我无法对此发表评论。

供参考:负责绘制这些的 Weka 源代码中的 class 是 weka.gui.AttributeVisualizationPanel。内部classes BarCalcHistCalc执行各自的计算。