sklearn.tree.export_graphviz 备选方案

sklearn.tree.export_graphviz alternatives

可以使用 pypi 中的 pydotplus 可视化决策树,但它在我的机器上有问题(它说它不是用 libexpat 构建的,因此它只在节点上显示数字而不是table 和一些信息),我想使用替代方法。我已经尝试使用 networkx,但它需要 pygraphviz 才能读取 .dot 文件并制作它们的 networkx 图。当我尝试使用 pip 安装它时也失败了。

所以现在我正在寻找一种可视化决策树的替代方法,可以使用 pip 或 anaconda 安装。



digraph Tree {
node [shape=box, style="filled", color="black"] ;
0 [label="grade.B <= 0.5\ngini = 0.5\nsamples = 37224\nvalue = [18476, 18748]", fillcolor="#399de504"] ;
1 [label="grade.C <= 0.5\ngini = 0.4973\nsamples = 32094\nvalue = [17218, 14876]", fillcolor="#e5813923"] ;
0 -> 1 [labeldistance=2.5, labelangle=45, headlabel="True"] ;
2 [label="gini = 0.4829\nsamples = 21728\nvalue = [12875, 8853]", fillcolor="#e5813950"] ;
1 -> 2 ;
3 [label="gini = 0.4869\nsamples = 10366\nvalue = [4343, 6023]", fillcolor="#399de547"] ;
1 -> 3 ;
4 [label="grade.A <= 14.8301\ngini = 0.3702\nsamples = 5130\nvalue = [1258, 3872]", fillcolor="#399de5ac"] ;
0 -> 4 [labeldistance=2.5, labelangle=-45, headlabel="False"] ;
5 [label="gini = 0.3555\nsamples = 4987\nvalue = [1153, 3834]", fillcolor="#399de5b2"] ;
4 -> 5 ;
6 [label="gini = 0.3902\nsamples = 143\nvalue = [105, 38]", fillcolor="#e58139a3"] ;
4 -> 6 ;


我在 Jupyter notebook 中对此进行了编程,但如果您尝试使用以下方法显示 SVG,则存在无法为 svg 着色的错误:

![Decision Tree]('dtree.svg')


from IPython.display import HTML

svg = None
with open('dtree.svg') as svg_file:
    svg =


这不是最性感的解决方案,但我使用通过 subprocess 调用的 Grapviz CLI(称为 dot),我在 Mac,所以我用自制软件安装了它,但您可以下载其他平台的二进制文件 from their downloads page。这是一个使用 Titanic 数据集的示例:

import pandas as pd
import subprocess
import seaborn.apionly as sns
fromwd sklearn.preprocessing import Imputer
from sklearn.tree import DecisionTreeClassifier, export_graphviz

raw_data = sns.load_dataset('titanic')
predictors = ['pclass','sex','age','sibsp','parch','fare','embarked','alone','adult_male']
categorical = ['sex','embarked']
numeric = [c for c in predictors if c not in categorical]

encoded_data = pd.get_dummies(raw_data[predictors], columns=categorical)

imputer = Imputer()
X = imputer.fit_transform(encoded_data).astype('float32')
Y = raw_data[target].astype('float32')

model = DecisionTreeClassifier(min_samples_leaf=10, max_depth=3), Y)

                impurity=False)['dot', '-Tpdf', '', '-o' 'tree.pdf'])

从版本 0.21 开始,scikit-learn 有 plot_tree 使用 matplotlib 绘制树的方法。

要使用的代码 plot_tree:

from sklearn import tree
# the clf is Decision Tree object

sklearn 图的替代方案可以是 dtreeviz 包。树的例子如下。使用的代码 dtreeviz:

from dtreeviz.trees import dtreeviz # remember to load the package
# the clf is Decision Tree object
viz = dtreeviz(clf, X, y,


您可以找到不同 scikit-learn 树绘图技术的比较 here