Chapter 14: Combining Models
来源:互联网 发布:php程序员简历项目经验 编辑:程序博客网 时间:2024/06/08 04:29
一:Introduction
1:相比于仅仅使用一个模型,多个模型结合在一起往往能够提高对数据集拟合的表现;
2:Committee:独立地训练L个不同的模型,然后将这L个模型预测的平均值作为最终的预测;
3:Boosting:该方法是committee的变体,连续地训练L个不同的模型,每次训练一个模型时其误差函数依赖于上一个模型对数据集拟合的好坏;相比于仅仅使用一个模型,这种方法能够大大提高对数据集拟合的表现;
4:Decision tree:有很多模型,根据输入变量的不同选择对应的一个模型;模型的选择依据树的二分查找
5:Mixtures of experts:decision tree的一个缺陷是对于每一个输入变量,只有一个模型与之对应,这称之为hard split;我们可以将hard split变成soft split,每一个输入变量,都有一定的概率对应着每个模型,有些模型对应的概率大,有些模型对应的概率小,类似的表达形式如下:
二:Bayesian Model Averaging
1:需要理解Combination methods和Bayesian model averaging,因为这两者经常容易混淆;
2:Combination methods:类似的表达形式为
3:Bayesian Model Averaging:其类似的表达式为
4:因此Bayesian model averaging和model combination关键不同在于Bayesian model averaging中每一个模型h负责产生整个数据集;而在Combination methods,所有的成分(模型)共同产生一个数据集。
三:Committees
1:训练L个模型然后将这L个模型预测值平均,这种方法能够提高预测表现的原因如下:从频率学家观点来看,误差分为bias和variance,bias来源于训练函数和真实函数预测值的差别,而variance表示模型对于训练集数据点的敏感程度;如果我们从不同的数据集中训练到了L个模型,将这L个模型均值,不同模型的varaince将会抵消,以此减少了误差,从而提高了预测表现;因此如果我们有了一组low-bias模型(模型复杂度较高),将这组模型平均,从而就能够得到比较好的预测表现;
2:假设我们有了一个单个数据集,用bootstrap方法产生了M个数据集,将M个数据集分布训练模型,从而得到了M个训练模型,然后将这M个训练模型的预测值平均,即得到了最终的预测值,表达形式如下:
四:Bosting
1:Boosting:该方法是committee的变体,连续地训练L个不同的模型,每次训练一个模型时其误差函数依赖于上一个模型对数据集拟合的好坏;相比于仅仅使用一个模型,这种方法能够大大提高对数据集拟合的表现;
2:Boosting中有一个被广泛使用的算法,称之为AdaBoost(adaptive boosting),其用于分类中两类问题的步骤如下:
(1):每个数据点都有一个对应的权重
(2):对于m=1,…,M:
(3):使用最终的模型做预测,模型公式如下:
在这里,我们已经假定了类别{
五:Conditional Mixture Models
1:Mixture of linear regression models
(1):线性回归混合模型的表达式如下:
2: Mixtures of logistic models
(1):logistic混合模型的表达式为
3:Mixtures of experts
(1):上述说的两个混合模型中的mixing coefficient
(2):在mixture of experts模型中,
(3):由于gating和expert函数均为线性模型,所以mixture of experts模型的灵活性依然会受到限制;如果单独成分
- Chapter 14: Combining Models
- 第十四章:Combining Models exercise 1-17
- PRML Chapter 9. Mixture Models and EM
- chapter 8:Graphical Models(图模型)
- Chapter 9: Mixture Models and EM
- ESL2 Chapter 17 Undirect Graphical Models
- The Idea of Combining Random Matrix and Graphical Models in Machine Learning
- PRML读书会第十四章 Combining Models(committees,Boosting,AdaBoost,决策树,条件混合模型)
- PRML Chapter 8. Graphical Models - 8.2.1 Three example graphs
- MLaPP Chapter 3: Generative models for distrete data
- MLaPP Chapter 4 Gaussian models 高斯模型
- MLaPP Chapter 11 Mixture models and the EM algorithm
- Chapter 6. Hidden Markov and Maximum Entropy Models
- Combining Probabilities
- Chapter 14 The Environment
- chapter 14 表单脚本
- chapter 14 类型信息
- Chapter
- Android studio编程时出现的错误:unspecified on project app resolves to an APK archive which is not supported
- 漫漫考研路之C语言的位运算
- JDBC配置文件以及数据库中那些增删改查
- 20161210
- 有关的进程概念
- Chapter 14: Combining Models
- 数据结构实验之排序五:归并求逆序数(讲解归并排序算法)
- Ubuntu 16.04 自学之 JDK
- layer 实现弹窗提交信息
- Facebook登录申请流程
- Android09
- JavaSE总结 -集合框架collection
- 数据结构图的基本操作--邻接表法(不包括深度、广度算法)
- Ajax之判断用户名是否存在