决策树Decision Tree
来源:互联网 发布:js数组增加一个元素 编辑:程序博客网 时间:2024/06/06 00:51
1 决策树流程
决策树遵循的是“分而治之”的策略流程。
2 信息熵
信息熵(information entropy),是衡量事物不确定的指标。
在信息增益度量中,熵值越小越好。
3 CART决策树
CART,Classification And Regression Tree,分类回归树,分类和回归都可用。
ID3采用信息增益率。
4 剪枝
剪枝是为了防止过拟合,提高泛化能力。分为“预剪枝”和“后剪枝”。
4.1 预剪枝
预剪枝是指,在构建树的时候判断是否对节点进行分支。判断是否对节点进行分支的准则就是确定其分支是否能够带来泛化性能的提升。泛化性能判断的做法就是用测试集确定。
在划分之前,所有样例集中在根节点。若不进行划分,则该节点被标记为叶节点,其类别标记为训练样例最多的类别,假设我们
4.2 后剪枝
后剪枝是指,先按训练集构建整棵完整的树,然后从最后一个非叶子节点开始通过测试集验证其剪枝后是否能提高泛化性能,方法类似预剪枝。
5 C4.5
在属性值缺失情况下,C4.5通过已知属性值个数占全部样本数的比例这种形式来计算属性的信息增益。信息增益最小的,就选那个属性作为当前树节点。
6 实验
数据集: Iris,150条记录
============================
c4.5
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.98 0 1 0.98 0.99 0.99 Iris-setosa
0.94 0.03 0.94 0.94 0.94 0.952 Iris-versicolor
0.96 0.03 0.941 0.96 0.95 0.961 Iris-virginica
Weighted Avg. 0.96 0.02 0.96 0.96 0.96 0.968
========================
naive bayes
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
1 0 1 1 1 1 Iris-setosa
0.96 0.04 0.923 0.96 0.941 0.992 Iris-versicolor
0.92 0.02 0.958 0.92 0.939 0.992 Iris-virginica
Weighted Avg. 0.96 0.02 0.96 0.96 0.96 0.994
=====================
logit regression
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
1 0 1 1 1 1 Iris-setosa
0.92 0.02 0.958 0.92 0.939 0.97 Iris-versicolor
0.96 0.04 0.923 0.96 0.941 0.975 Iris-virginica
Weighted Avg. 0.96 0.02 0.96 0.96 0.96 0.982
==================
bp 神经网络
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
1 0 1 1 1 1 Iris-setosa
0.96 0.02 0.96 0.96 0.96 0.996 Iris-versicolor
0.96 0.02 0.96 0.96 0.96 0.996 Iris-virginica
Weighted Avg. 0.973 0.013 0.973 0.973 0.973 0.998
bp神经网络效果最好。
- 3.决策树Decision Tree
- 决策树(Decision Tree)
- 决策树(Decision Tree)
- 决策树(Decision Tree)
- 决策树decision tree分析
- 决策树(Decision Tree)
- 决策树Decision Tree
- 决策树Decision tree简析
- Decision Tree决策树
- 决策树(Decision tree)
- 决策树(Decision Tree)
- 决策树(Decision tree)
- 决策树(decision tree)
- 决策树Decision tree
- 决策树(Decision Tree)
- 决策树(Decision Tree)
- 决策树decision tree
- Decision Tree(决策树)
- 【JZOJ 4786】小a的强迫症
- Xcode8.0 更新之后遇到的那些坑 实时更新
- IOS OpenGLES2.0 入门01 清空屏幕
- UE4成批处理透明材质
- 单元测试系列一:单元测试之道
- 决策树Decision Tree
- 乡村走访
- 【Bash百宝箱】shell内建命令之break与continue
- 用户管理(4)---chage、whoami
- 自定义的标识符、关键字、注释、常量
- 【JZOJ 4787】数格子
- JAVA设计模式之适配器模式
- windy数 【数位DP】
- 两个数相减,不能用加减乘除做减法