Azure 机器学习决策树熵/信息增益

Azure Machine Learning Decision Tree Entropy / Information Gain

在 Azure ML 中训练决策树时,有没有办法查看每个特征的 Entropy/Information 收益?

传统节点性能:

您目前只能在提升决策树模型中查看 gini 的相对增益。右键单击并可视化经过训练的提升决策树的输出,图片链接如下。从那里,等待树加载。然后您可以单击每个单独树的节点以查看每个级别的拆分收益。

Entropy/Information 收益:

尽管让我们退后一步,问我们为什么要查看熵?熵是单个树中节点特定的度量。 Azure 机器学习没有单树 class 器,例如 R 中的 rpart,只有决策森林、决策丛林和提升决策树模块形式的树集合。

变量重要性:

因此,我猜您正在寻找 variable/feature 重要性度量,它是集合内所有树中所有节点分裂的总 gini/entropy/information 增益的聚合或平均值。 Azure ML 有一个模块,该模块根据经过训练的算法计算特征重要性,称为排列特征重要性模块。它通过您训练的模型 运行 随机预测变量值来查看响应 class 变化的幅度。