程序博客网 > 快递群发短信软件

基于残差的提升树

来源：互联网发布：快递群发短信软件编辑：程序博客网时间：2024/06/05 03:33

注：本文中所有公式和思路来自于李航博士的《统计学习方法》一书，我只是为了加深记忆和理解写的本文。

首先应该先介绍一下提升树，提升树模型采用了加法模型和前向分布算法，基于决策树的提升也就是提升树，也就是多个基函数累加得来，这里的基函数我们可以广泛的指代我们常用回归或者分类器而不仅仅是y=ax+b这种直观的函数，例如决策树、SVM等，因为我们给定一个样本x会输出对应的预测值y，所以可以将决策树、SVM这些算法当成基函数f。

既然是基于残差的决策树，那么就有基于其他的决策树，后续还会介绍基于伪残差的决策树（GBDT），所谓残差就是样本x的标记值y与预测值的差值而已

提升树算法：

提升树是加法模型和前向分布算法的结合实现的，这个加法模型我们不妨用如下公式表达：

那么首先不出意外会要确定一个f₀(x₀)，这里不妨设定f₀(x)=0，那么第m步的模型应该是：

其中f_m-1(x)是当前的模型，f_m(x)是下一个要算的，通过经验风险极小化求得下一棵决策树的Θ_m

当采用平方误差作为损失函数时，则有

将f(x)带入公式，此时的损失为：

其中r = y - f_m-1(x)就是前边提到的残差，所以提升树实际是针对残差进行拟合的

具体算法如下：

到这就将提升树的推导过程以及算法介绍完了，实际上个人觉得这种方式会很容易过拟合，即使是后续要介绍的GBDT也是很有可能造成过拟合（个人认为）。

1 0

快递群发短信软件

快递群发短信软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子狗窝团狗仔队道具狗仔队道具卡购物兔官网孤胆猎人孤岛惊魂2百度影音孤岛惊魂qvod 孤岛惊魂快播孤儿仔演唱会孤男寡猫朕要爱妃孤山画室孤山密室逃脱姑娘湖底捡金条轱辘思思菇菇丁古堡决斗古晨天天向上古晨个人资料古晨图片古代寄居蟹化石古代建筑狂想曲古代军人长期在外征战如何解决生理需求古代闲逸生活古代熊猫人香料古德里安妻子古典辣妹组合古画武学第一卷古加奥特曼国语古加奥特曼国语全集古加奥特曼全集古建筑刷成土豪金古今时空穿穿穿古今书屋古克罗克的甲壳古力娜扎下部好鼓古树突然变性古冶党群e家古语说狐死必首丘古振光古知亜美莉古竹参天打一字