<机器学习>---决策树---补充
来源:互联网 发布:vscode markdown 预览 编辑:程序博客网 时间:2024/06/07 00:38
本篇是在李航老师的《统计学习方法》的决策树基础上补充周志华老师的《机器学习》西瓜书的一点内容。
1.连续值处理:
当特征属性可取连续值的时候,就出现这个问题了。比如西瓜的含糖率,密度值这样的特征属性。
但其实,我们可以获取的样本,他们在连续属性上的取值都只是一个确定的值了。因此, 假定17样本,就会有17个(或者小于17,因为可能取值相同了,这里就假使17个不同的a特征的取值),按照取值从小到大的顺序排序: a1 a2 a3 ......a17 。 序列中间有16个间隔,每个间隔取一个值,这个值是两相邻值的平均值,例:a1 a2 之间取一个均值a12, a12作为a1 a2 的间隔值。依次类推,可得到16个新的a的特征取值,把这16个值作为a特征的所有可能取值,就可以和之前的离散特征取值一样生成决策树了。
2.对缺失值的处理:
缺失值是表示,获取的训练样本,的一些特征下的具体取值未知。如:
补救方法:
以色泽为例,为17 -3=14(即色泽那一列没有“—”的样本个数)
然后计算规则如下:
然后,处理缺失的特征值怎么归类:
一般wx是初始化为1的。
wx*rv
多变量决策树。。。。没太看懂,明白后再来补充。。。欢迎指正!
阅读全文
1 0
- <机器学习>---决策树---补充
- 机器学习笔记--决策树&决策树可视化
- 机器学习实战-Scikit决策树分类算法
- 机器学习(周志华)习题解答-决策树(4.1-4.10)
- 【机器学习-西瓜书】四、决策树:信息熵;信息增益;增益率;ID3;C4.5
- 机器学习-降维
- 机器学习-GMM心得体会
- Machine Learning--决策树(一)
- 决策树 -- 基于ID3算法
- OC学习笔记九 Protocol、Block、成员变量-补充
- Google名词解释-补充材料
- 决策树-泰坦尼克号生还预测
- OpenCV学习笔记(8)-机器学习
- 机器学习算法---决策树
- 机器学习2决策树
- 机器学习-决策树
- 机器学习---决策树
- 机器学习实战---决策树
- ZennoPoster
- 如何利用Java库学习神经网络
- Android 环信的简单使用
- CoordinatorLayout和AppBarLayout(android MD 三)
- 入一个整数数组,实现一个函数,来调整该数组中数字的顺序使得数组中所有的奇数位于数组的前半部分,所有偶数位于数组的后半部分。
- <机器学习>---决策树---补充
- NOIP集训Week 7总结
- Ajax-Js原生Ajax和Jquery的Ajax(一)
- 如何用atom直接运行python程序
- 饮料新品难存活,经销商需避开哪些选品雷区
- [Unity 网络]网络基础
- 用JavaSE知识写生成验证码功能
- java学习第39天,集合的排序
- 复杂度分析之很多重循环