无法理解 WEKA 中的直方图

Fail to understand histogram in WEKA

我是 Weka 的新手。我有一个数据集。当我尝试在预处理阶段加载数据集时,我得到了下图

我的数据集中有一个 class。该数据集预测癌症。它是恶性的还是良性的?蓝色部分为恶性,红色部分为良性。

我想知道这个直方图是什么意思?这里一部分是蓝色,一部分是红色,一部分是红蓝混合。

还有一些数字,如 189,104,128 与直方图相关联。

谁能给我解释一下图表?

谢谢。

  • 乳腺癌数据集中的 clump 属性是数字(如您所说,class 是二进制的)。
  • 此属性的值已分为 八个 bin
  • 每个 bin 上方的数字表示数据集中属于该特定 bin 的行数。
  • 颜色比例显示有多少行属于 class。如您所见,簇越小,benign 行落入 bin 的行数越多,簇越大,则越多 malignant.