决策树分类预测过程可视化
来源:互联网 发布:上海地铁免费查询软件 编辑:程序博客网 时间:2024/06/05 06:09
作者: 王彦平
开始前的准备工作
首先导入所需库文件,numpy,pandas用于数值处理,DictVectorizer用于特征处理,graphviz用于模型可视化。
#导入所需库文件import numpy as npimport pandas as pdfrom sklearn.feature_extraction import DictVectorizerfrom sklearn import cross_validationfrom sklearn import treeimport graphviz
导入所需的数据文件,用于训练和评估模型表现。
#导入数据表test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))
特征处理
第二步,对特征进行处理。
#特征处理X_df=test[['City', 'Item category', 'Period', 'Gender', 'Age', 'Market channels', 'Self-agent', 'Category', 'Loan channels']]X_list=X_df.to_dict(orient="records")vec = DictVectorizer()X=vec.fit_transform(X_list)Y=np.array(test['Status'])划分训练集和测试集数据。
划分训练集和测试集数据
X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0)
训练模型并进行预测
使用训练集数据对决策树模型进行训练,使用测试集数据评估模型表现。
#训练模型clf = tree.DecisionTreeClassifier(max_depth=5)clf=clf.fit(X_train,y_train) clf.score(X_test,y_test)0.85444078947368418
简单对测试集的第一组特征进行预测,结果与实际值相符。
#对测试集数据进行预测clf.predict(X_test[0]),y_test[0](array(['Charged Off'], dtype=object), 'Charged Off')
查看具体的分类概率值。
#查看分类概率clf.predict_proba(X_test[0])array([[ 1., 0.]])
决策树分类预测可视化
第三步,对决策树的分类预测过程进行可视化,首先查看分类结果及特征的名称。
#获取分类名称clf.classes_array(['Charged Off', 'Fully Paid'], dtype=object)
对决策树进行可视化,feature_names为特征名称,class_names为分类结果名称。
#决策树可视化dot_data = tree.export_graphviz(clf, out_file=None, feature_names=vec.get_feature_names(), class_names=clf.classes_, filled=True, rounded=True, special_characters=True) graph = graphviz.Source(dot_data) graph
将分类结果保存为PDF格式文档。
#导出PDF文档graph.render("test_e1")
End.
转载请注明来自36大数据(36dsj.com):36大数据 » 决策树分类预测过程可视化
阅读全文
0 0
- 决策树分类预测过程可视化
- Python 决策树预测 分类算法
- 决策树分类和预测算法的原理及实现
- 决策树分类和预测算法的原理及实现
- 决策树分类和预测算法的原理及实现
- GBDT决策树集成学习残差预测和分类
- 机器学习之决策树分类和预测算法原理
- 决策树分类
- 分类:决策树
- 决策树分类
- 分类-决策树
- 决策树分类
- 分类决策树
- 分类决策树
- 分类决策树
- 决策树-NBA比赛预测
- 【ML--15】在R语言中使用决策树算法做多分类预测
- pyhon实现决策树(ID3)算法进行数据的分类预测
- Android状态栏微技巧,带你真正理解沉浸式模式
- 20个数据可视化工具点评
- 10月18日云栖精选夜读:解读OpenMessaging开源项目_阿里巴巴发起首个分布式消息领域的国际标准
- 禁用按钮
- Android 引导页面 欢迎页面
- 决策树分类预测过程可视化
- 英媒:走入欧洲最大的数据可视化实验室
- 数据可视化难在哪里?该如何入门
- 对人工神经网络的隐式行为进行可视化
- 数据分析图的十大错误,你占了几个?
- 数据可视化:常用图表使用总结
- 22个免费的数据可视化和分析工具推荐
- scikit-learn SVM
- java web端调用tensorflow模型