值列表在决策树图中意味着什么

What does the value list mean in a Decision Tree graph

查看此问题时, I have trouble understanding the value list of the Decision Tree。例如,顶部节点的值=[1,3]。 1和3到底是什么?这是否意味着如果 X[2]<= 0.5,则 1 为假,3 为真?如果是这样,则值列表是[错误案例数,真实案例数]。如果是这样,叶子的值列表呢?

  1. 为什么右边的三片叶子是[0,1],左边的一片叶子是[1,0]?
  2. [1,0] 或 [0,1] 到底是什么意思?一假零真还是零假一真?但是叶子上没有条件(比如<=.5)。那什么是真什么是假呢?

非常感谢您的建议!

value=[1,3] 意味着,在这棵树的确切叶子中(在应用过滤器 x[2] <=0.5 之前),您有:

  • class0
  • 的 1 个样本
  • 3 个示例 class 1

一旦你沿着树往下走,你就是在过滤。您的 objective 已完全分离 classes。所以你往往有类似 value=[0,1] 的东西,这意味着在应用所有过滤器之后,你有 0 个样本 class 0 和 1 个样本 class 1.

您还可以检查值的总和是否始终与样本相似。这是完全有道理的,因为值只是告诉你到达这片叶子的所有样本是如何分布的。