决策树可视化环境搭建

来源:互联网 发布:数据库中的字典表使用 编辑:程序博客网 时间:2024/05/17 21:55

        scikit-learn中决策树的可视化一般需要安装graphviz。主要包括graphviz的安装和python的graphviz插件的安装。

      graphviz :graphviz是贝尔实验室开发的一个开源的工具包,它使用一个特定的DSL(领域特定语言):dot作为脚本语言,然后使用布局引擎来解析此脚本,并完成自动布局。graphviz提供丰富的导出格式,如常用的图片格式,SVG,PDF格式等。


1. 环境搭建


1.1 第一步是安装graphviz

        下载地址http://www.graphviz.org/。如果你是linux,可以用apt-get或者yum的方法安装。如果是windows,就在官网下载msi文件安装。无论是linux还是windows,装完后都要设置环境变量,将graphviz的bin目录加到PATH,比如我是windows,将C:/Program Files (x86)/Graphviz2.38/bin/加入PATH。


1.2 第二步是安装python插件graphviz

        在命令行输入pip install graphviz即可安装。


1.3 第三步是安装python插件pydotplus

         在命令行输入pip install pydotplus。


         至此就完成环境的搭建了。有时候python会很笨,仍然找不到graphviz,这时,可以在代码里面加入这一行:

os.environ["PATH"] += os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/' #注意后面的路径是你自己的graphviz的bin目录。

2. 示例演示

from sklearn.datasets import load_iris # 导入类库from sklearn import treeimport pydotplus import sysimport os       os.environ["PATH"] += os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/'iris = load_iris() # 载入sciki-learn的自带数据clf = tree.DecisionTreeClassifier() # 载入决策树分类模型clf = clf.fit(iris.data, iris.target) # 决策树拟合,得到模型with open("iris.dot", 'w') as f: # 将模型存入dot文件iris.dot    f = tree.export_graphviz(clf, out_file=f)    # 第一种方式,用graphviz的dot命令生成决策树的可视化文件#在命令行执行 dot -Tpdf iris.dot -o iris.pdf, 执行完成后当前目录就可以看到决策树的可视化文件iris.pdf.#打开可以看到决策树的模型图。# 第二种方式,用pydotplus生成iris.pdfdot_data = tree.export_graphviz(clf, out_file=None) graph = pydotplus.graph_from_dot_data(dot_data) graph.write_pdf("iris.pdf") 


3. 运行结果