Apache Spark 决策树中 If Else 条件中的行数

No of rows in If Else condition in Apache Spark Decision Tree

我有一个包含 100 条记录的数据集,我 运行 使用该数据集的决策树。

On println(model.toDebugString)

输出是:

DecisionTreeModel classifier of depth 3 with 7 nodes
  If (feature 0 <= 2.0)
   Predict: 0.0
  Else (feature 0 > 2.0)
   If (feature 1 <= 12354.0)
    If (feature 2 <= 14544.0)
     Predict: 1.0
    Else (feature 2 > 14544.0)
     Predict: 0.0
   Else (feature 1 > 12354.0)
    Predict: 1.0

是否可以知道有多少行将进入 If 条件和 Else 条件?

like 40 rows are in If (feature 0 <= 2.0) and 60 rows are in Else (feature 0 > 2.0)

遗憾的是,目前还没有神奇的方法来计算它。你需要循环你的条件并过滤然后计数。

示例:df.filter([condition1]).count