机器学习笔记(XI)决策树(I)基本流程和划分选择
来源:互联网 发布:投资返利源码 编辑:程序博客网 时间:2024/06/05 11:50
基本流程
决策树
一般的,一棵决策树包括包含一个根结点,若干个内部结点和若干个叶结点。
根结点
包括样本全集
从根结点到每个叶子结点的路径对应一个判定测试序列。
内部结点
一个测试属性
叶结点
决策结果
目的
产生一棵泛化能力强的,处理未预见示例能力强的决策树,基本流程遵循简单且直观“分而治之”(
基本算法
算法中的三种递归返回(三个return)
1:当前结点包含的样本全属于同一类别,无需再划分
2:当前属性集为空,或是所有样本在所有属性取值相同,无法划分。(此时:把当前结点标记为叶子节点,将其类别设定为该结点所含样本最多的类别,利用当前结点后验分布)
3:当前结点包含样本集合为空,不能划分(此时:同样把当前结点标记为叶子结点,但是其类别是父结点所含样本最多的类别,把父结点的样本分布作为当前结点的先验分布)
划分选择
信息增益
信息熵(information entropy )
作用:度量样本集合纯度的最常用的一种指标
假定当前样本集合
信息增益
假定离散属性
计算
定义信息增益:
作用
一般而言,信息增益越大,则意味着使用属性
不同的算法,不同的a∗
ID3
C4.5
增益率
其中
决策方法
从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率最高的。
CART
基尼指数
基尼值Gini(D)
基尼指数
决策方法
阅读全文
0 0
- 机器学习笔记(XI)决策树(I)基本流程和划分选择
- 机器学习笔记 - 决策树最优划分属性选择
- 机器学习实战之决策树(2)---选择最好的特征来划分数据集
- 机器学习笔记 - 决策树基本算法
- 机器学习笔记---决策树
- 机器学习笔记:决策树
- 【机器学习笔记】决策树
- 机器学习笔记(八)——决策树模型的特征选择
- 机器学习笔记(PART I)基本术语
- 机器学习实战笔记(三)决策树
- 机器学习笔记(三) 决策树
- 机器学习笔记(六) 决策树
- 机器学习笔记(八)决策树
- 机器学习-决策树学习笔记
- 机器学习实战笔记:决策树
- 机器学习笔记_ 决策树
- 机器学习笔记(四)决策树
- 机器学习笔记十一:决策树
- Gradle2.0用户指南翻译——第十二章. 使用Gradle 图形用户界面
- cmd 命令 单独导出class 文件
- Java常见的面试问题(带答案),自己答出来多少?
- ubuntu 安装 apktool
- 二叉排序树的基本操作
- 机器学习笔记(XI)决策树(I)基本流程和划分选择
- 浅谈 Python 的 with 语句
- Qt核心剖析:信息隐藏
- 黑盒测试的测试方法
- 双栏布局的几种方法:左边固定,右边自适应
- 第十四周项目一
- android 添加删除线TextView
- 两个不一样的集群导数据
- STM32F105VC波特率不一致