GBDT-沿着梯度提升的决策树

来源:互联网 发布:centos macaddr 不写 编辑:程序博客网 时间:2024/06/05 17:38

注:本文中所有公式和思路来自于李航博士的《统计学习方法》一书,我只是为了加深记忆和理解写的本文。



在上一篇文章中,介绍了基于残差的提升树,采用加法模型和前向分布算法,损失函数为平方损失,优化过程比较容易,但对于一般的损失函数,可能不会这么容易,因此提出了梯度提升的算法。利用的是最速下降法的近似方法,其关键是利用损失函数的负梯度在当前模型的值

作为回归提升树中的残差近似值,拟合一棵决策树。

具体算法如下:





其中需要解释几个与提升树的不同之处,在第一步中,我们本来应该是y与预测值y~的差值,这里设f(0)为常数,y~=c*f(0),所以统一划归为c中(其实f(0)可以通过求导消掉,我们姑且理解为划归入c中)。在第(2)(a)步中,损失函数对f(x)求偏导计算出损失函数的负梯度在当前模型的值,将它作为残差的近似(伪残差),第(2)(b)步中,估计回归树叶节点区域,用来拟合残差的近似值,第(2)(c)步用线性搜索方式估计叶节点区域的值,使得损失函数极小化,最后一步(d)更新回归提升树。



基于残差的提升树


0 0