在 SPSS Data Modeler 的 Exhaustive CHAID 中配置节点标识符选项

Configuring the Node Identifier Option in Exhaustive CHAID in SPSS Data Modeler

根据 IBM 的 online help

  • Optionally, for CHAID, QUEST, and C&R Tree models, an additional field can be added that indicates the ID for the node to which each record is assigned.

我找不到那个选项。我正在使用(详尽的)CHAID,它添加了 $R-(预测字段)变量,但没有 $RI-(节点标识符字段)变量。为了以防 IBM 是字面意思,我检查了 运行 一个常规的 CHAID(并不详尽),但仍然没有得到我需要的 $RI 变量。

我知道在 SPSS v.25 中这很容易配置,所以 IBM 只是在他们的建模器在线帮助中感到困惑,还是我遗漏了一些明显的东西?在此先感谢您的帮助。

获取添加到数据集中的规则标识符,需要先训练模型生成模型块。 然后您可以编辑(或打开)模型块和 select "Settings" 选项卡。在这里您会找到选项 "Rule identifier",必须选中该选项以包含分配每条记录的节点 ID。

重要的是要认识到这是生成的 mudel 块中的设置,而不是建模节点中的设置。这也意味着每次重新训练模型和重新生成块时都必须检查(并重新检查)此设置。