程序博客网 > 英雄联盟淘宝网

Blending and Bagging

来源：互联网发布：英雄联盟淘宝网编辑：程序博客网时间：2024/05/21 19:42

Blending and Bagging

目录(?)[+]

第七讲：Blending and Bagging

1、Motivation of Aggregation（融合的动机）

恰当的融合可以得到更好的表现

2、Uniform Blending(平均融合)

分类

回归

理论分析：

所有误差g的平均 >= 平均的误差G

但是最好的误差g是否比平均的误差G不知道。

演算法的平均表现 = 个别与共识的差距(variance) + 共识的表现(bias)

平均的过程：消除个别与共识的差距，从而得到更稳定的表现

3、Linear Blending(线性融合)

线性融合 = 线性模型 + g当作转换 +条件（a>=0）

条件（a>=0）这一项可以去除，当a<=0时表示这一项起反效果。

Linear Blending在Selection时候:

应该通过 E_val而不是E_in；

相应的在D_val上验证的模型应该是g^-而不是g。(若是选择g，因为这些model在D_data上训练，D_data=D_train+D_val，所以相当于见过D_val，可能会过拟合)

linear Blending 和 any Blending OR Stacking(non-linear):

通过在D_train上训练一批模型g^-，然后在D_val上验证找出最好的alpha，但是最后返回的模型是alpha和g。

例举了台大在2011 KDDCup通过Blending拿到冠军的故事，说明Blending确实很有效如果不惜计算量的话。

4、Bagging(Bootstrap Aggregation)

blending:在得到g后融合。

learning:一边学到g一边融合起来

g是如何得到的呢？

模型的不同、参数的不同、算法随机性的不同、数据随机性的不同

很多g的共识比单一g好，但是手上没有大量的数据产生不同的g。

boostrapping的思想:从手上有限的数据模拟出不同的数据。

boostrapping:从N个数据中有放回随机采样N(或少于N)次，每次采样1个样本。意味着同一个数据可能被采样多次。

boostrap aggregation(BAGging):建立在base算法上的meta算法。

例子：由25条Bagging Pocket产生的线融合得到的一个效果还可以的分类线。

如果base算法对数据随机性敏感的话，Bagging 会得到不错的效果。

练习：boostrap过程有N^N情形产生，里面有N！种会是原来数据的排列组合

0 0

英雄联盟淘宝网

英雄联盟淘宝网

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子锦年春浓作品锦屏春暖锦帷香浓锦帷香浓欣欣向荣快穿之尤物养成锦年春浓什么的浓雾浓雾北京下半年首场特强浓雾特美浓祛斑霜浔浔怎么读浔阳江头夜送客浔龙河浔龙河生态小镇江浔安苏怀染浔阳江苏怀染江浔安苏怀染江浔安章节目录浔龙河生态艺术小镇长沙浔龙河非浔天下浔峰岗地铁站浔峰岗中国浔阳浔兴股份福建浔兴福建浔兴吧浔兴吧浔兴浔兴股份股吧浔兴股份股票 002098浔兴股份福建浔兴男篮浔兴股份股票吧浔兴股份怎么样浔兴股份行情浔兴股份股票行情浙j 浙j车牌浙j哪里车牌浙j是哪里的牌照浙j是哪里的车牌