Python 决策树 - 创建包含变量名称的决策树的图形表示

Python Decision Trees - Creating a graphical representation of a decision tree which includes variable names

我正在 Python 上使用决策树做一些工作,使用 scikit 学习。分类器本身工作得很好,但是当我创建它的图形表示时,而不是显示变量名称,X[0]、X[1]...X[n] 显示变量,如在 scikit 中学习示例:http://scikit-learn.org/stable/modules/tree.html。让事情变得更困难的是 X[0] 甚至不一定与第一列相关,X[1] 与第二列相关,等等,似乎在分配我的变量 new 'X-related' 时正在进行一些过程名字。

我怎样才能将变量名放在图形表示上,将我的原始变量名映射到它们的新对应物,或者确保新变量名是有序的?

tree.export_graphviz() 方法有一个参数叫 feature_names 来指定特征名称,document 说:

feature_names : list of strings, optional (default=None)
Names of each of the features.

特征名称的顺序是您训练模型的特征向量中特征的顺序。