如何查看对预测结果影响最大的列?

How to see the column that influences the prediction result the most?

我正在使用 Azure 机器学习工作室,以便使用 Two-Class 提升决策树和拆分数据来预测列。

我组装的图表可以在这里找到:

我需要的是我希望看到数据集中对预测影响最大的列。换句话说,比数据集中其他列更能改变预测结果的列。

抱歉,如果之前有人问过这个问题,但我找不到这个简单问题的正确答案。

决策树的大多数 ML 实现在其模型中包含称为“特征重要性”的东西。例如,Scikit Learn Decision Tree Classifier 有一个属性表示每个特征的重要性。

Azure ML 实施也不例外。请看下面linkPermutation Feature Importance.

如前所述,排列特征重要性可以解决问题。将 Permutation Feature Importance 块附加到训练块上,单击输出端口,然后 select 可视化以获取模块的结果。上图显示了按排列重要性分数降序排列的特征列表。

一个建议:当你有高相关特征时,在解释排列分数的结果时要小心。

有关详细信息,请参阅: https://standupdata.com/category/permutation-feature-importance/ https://gallery.cortanaintelligence.com/Experiment/Permutation-Feature-Importance-5