集成学习-学习笔记
来源:互联网 发布:揭东军埔淘宝村 编辑:程序博客网 时间:2024/06/06 14:23
集成学习
集成学习由多个个体学习器组成,如果集成是‘同质’的(即所有个体学习器是同一种算法)那么这些个体学习器称为基学习器(base learner)。‘异质’的称为‘组件学习器’(component learner).
个体学习器应满足两个条件
- 准确性
- 多样性
第一,如果学习器不准确,那么也就没用了;第二,如果学习器没有多样性那么再多的个体学习器也等于一个学习器,并没有数量上的优势。
一、boosting
还不太了解以后补充。。。。。
二、bagging
利用有放回的重采样(自助采用法)来产生多样性。
假设有m个样本的数据集,经过m次的有放回随机采样,得到m个样本的采用集。
可以采用出T个采样集,然后基于每个采样集训练处一个基学习器,再将这些基学习器进行组合。
对于分类任务使用简单投票法,对于回归任务采用简单平均法。
自助采用法有个好处就是可以进行包外估计。
三、随机森林 = bagging + 随机属性选择
随机森林(Random Forest)是在Bagging的基础上,进一步在决策树的训练过程中加入了随机属性选择。
在RF中,对于基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分。
随机森林中基学习器的多样性不仅来自样本扰动还来自于属性扰动,这使得最终集成的泛华性能可通过个体学习器之间差异度的增加而进一步提高。
0 0
- 集成学习-学习笔记
- 数据集成学习笔记 --- DataX学习笔记
- [学习笔记]信息系统集成技术
- Quartz Spring集成学习笔记
- Storm学习笔记-集成Kafka
- Android学习笔记--ViewPagerIndicator集成
- ensemble learning(集成学习)笔记
- 集成学习学习笔记(1)
- 集成学习学习笔记(2)
- 集成学习-模型融合学习笔记
- 机器学习笔记(八)集成学习
- 机器学习笔记(5)-集成学习
- 机器学习笔记——集成学习
- 机器学习笔记四------集成学习
- Spring学习笔记:spring集成hibernate
- QT学习笔记- eclipse集成的designer
- Spring学习笔记:spring集成hibernate
- Spark学习笔记-Streaming集成Flume
- 多项式相加
- Mybatis 如何传入多个参数
- 【有序链剖】Data Structure Special Training 1 T3 seqmod 题解
- Andriod ListView线程问题
- 深入浅出SQL:3 DELETE / UPDATE
- 集成学习-学习笔记
- hdu 1142 A Walk Through the Forest
- 深入PHP面向对象、模式与实践——生成对象(3)
- Opencv路径的统一修改以及不同版本路径的转换
- swift中的block
- 1135: 算菜价
- linux定时任务
- java ee学习路线
- 使用wsdl2java开发webservice客户端