机器学习基本算法（5 （adaboost、 Gradient boost

来源：互联网发布：清理恶意软件编辑：程序博客网时间：2024/06/08 06:51

adaboost

boosting：增强的 adaboost 适应的增强
适应的增强就是给你好多个弱的方案，让你经过不断地适应增强得到一个新的好方案。
就是让孩童来讨论一个问题，比如什么是太阳一人只能说一条
那就有很多说法太阳是圆的，发光的等等
但每个人说法都是片面的弱的
adaboost的所求目标
这里写图片描述
这里我们要得个每个弱方案的权重和弱方案

对第一个方案，给每一个样本都赋予一个权重 w，这些权重变成了D向量
用任意的弱方法做分类。
因为是弱方法，肯定会有很多错误。错误率 e e=没做对的做对的
好了这个弱方案的权重就订下来了做对越多权重越高
（但弱方案权重高也高不到哪去，这是为了防止被独占了发言权）

权重随你定这边用 12ln1−ee

好那下一个方案也可以出来了什么叫自适应就是在原来的地方自己调整
把那些做错的给注明出来对的先不看了（就是增加做错的权重）
这个方法也很多
这边用做对的 Dt+1i=Dtie−aSum(D)
做错的 Dt+1i=DtieaSum(D)

好了新的方案也找出来了开始进行下一轮讨论

直到完成目标

Gradient boost

在分类问题中adaboost可以很有作用但是如果是回归的问题就不能用adaboost这样来做
Gradient boost 梯度优化既然不能直接优化，我改用梯度不就行了，梯度下降来拟合数据

adaboost 每轮直接定权重 Gradient boost 计算残差（实值和计算值的差）梯度逼近残差
转化成数学计算就是算下面这个
这里写图片描述
找一个最优的属性划分，使得两侧的真实值与各自平均值的差的平方和最小。然后求每个值的余数，进行下一次划分。
然后再确定权重

这里写图片描述

值得注意的是求出g权重后最后还要对η最优化，不过η只需要求导即可。

Gradient boost就是每次都是整体取最优而adaboost是把当前次的做到最好

代码

#Import Libraryfrom sklearn.ensemble import GradientBoostingClassifier# X  Y for training data set and x_test_dataset# Create Gradient Boosting Classifier objectmodel= GradientBoostingClassifier(n_estimators=100, learning_rate=1.0, max_depth=1, random_state=0)model.fit(X, y)#Predict Outputpredicted= model.predict(x_test)

0 0

机器学习 基本算法 （5 （adaboost、 Gradient boost

adaboost

Gradient boost

机器学习基本算法（5 （adaboost、 Gradient boost