程序博客网 > 在手机上java编程软件

GDBT

来源：互联网发布：在手机上java编程软件编辑：程序博客网时间：2024/06/06 15:45

转载http://blog.csdn.net/a819825294

1.模型

提升方法实际采用加法模型（即基函数的线性组合）与前向分布算法。以决策树为基函数的提升方法称为提升树（boosting tree)。对分类问题决策树是二叉分类树，对回归问题决策树是二叉决策树。提升树模型可以表示为决策树的加法模型：
其中，表示决策树；为决策树的参数；M为树的个数

2.学习过程

回归问题提升树使用以下前向分布算法：

在前向分布算法的第m步，给定当前模型，需求解

得到，即第m棵树的参数

当采用平方误差损失函数时，

其损失变为

其中,是当前模型拟合数据的残差（residual）。对于平方损失函数，拟合的就是残差；对于一般损失函数（梯度下降），拟合的就是残差的近似值

3.算法

输入：训练数据集

输出：提升树

算法流程：
（1）初始化
（2）对m = 1,2,…，M

计算残差
拟合残差学习一个回归树，得到
更新

（3）得到回归问题提升树

附sklearn中GBDT文档地址

4.GBDT并行

这部分整理自网络资源，思路很好，可以借鉴

非递归建树
- 节点的存放
- 终止条件
  - 树的节点数
  - 树的深度
  - 没有适合分割的节点
特征值排序
- 在对每个节点进行分割的时候，首先需要遍历所有的特征，然后对每个样本的特征的值进行枚举计算。（CART）
- 在对单个特征量进行枚举取值之前，我们可以先将该特征量的所有取值进行排序，然后再进行排序。
- 优点
  - 避免计算重复的value值
  - 方便更佳分割值的确定
  - 减少信息的重复计算
多线程/MPI并行化的实现
- 通过MPI实现对GBDT的并行化，最主要的步骤是在建树的过程中，由于每个特征值计算最佳分割值是相互独立的，故可以对特征进行平分，再同时进行计算。
MPI并行化的实现
- 主线程
- 其他线程

阅读全文

0 0

在手机上java编程软件

在手机上java编程软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子 1岁宝宝总是打嗝怎么办 3岁宝宝总是打嗝怎么办 2岁宝宝一直打嗝怎么办 2岁宝宝总是打嗝怎么办 8天宝宝总是打嗝怎么办 4岁宝宝总是打嗝怎么办小孩老是吐奶怎么办啊两岁了总是吐奶怎么办打嗝不止怎么办4天了打嗝不止怎么办7天了吃了饭就打嗝是怎么办汽车车门锁坏了怎么办空燃比过浓怎么办空燃比太稀怎么办行车证副本满了怎么办剑灵冰库暴走怎么办喝冰可乐咽喉疼怎么办可乐喝多了难受怎么办睡眠质量差怎么办多梦血压低怎么办吃什么好侧面看额头很平怎么办酒心巧克力太稀怎么办怀孕了吃了辣条怎么办手切辣椒特别辣怎么办手被青椒辣了怎么办手被辣椒辣着了怎么办手接触辣椒很辣怎么办切完辣椒手烧怎么办手被辣椒辣的疼怎么办手弄辣椒很辣怎么办手被辣子辣到了怎么办辣椒辣到手好痛,怎么办手让辣椒辣的疼怎么办摸辣椒多了手烧怎么办手切辣椒了好疼怎么办手切辣椒辣的疼怎么办手指辣椒辣的疼怎么办手被辣椒辣了怎么办手搞到辣椒很辣怎么办切辣椒辣到眼睛怎么办被尖椒辣了手怎么办