机器学习基石-The VC Dimension
来源:互联网 发布:手机nba直播软件 编辑:程序博客网 时间:2024/05/16 18:49
大纲
Definition of VC dimension
1 回顾
首先,我们知道如果一个假设空间H有break point k,那么它的成长函数是有界的,它的上界称为Bound function。根据数学归纳法,Bound function也是有界的,且上界为Nk−1。从下面的表格可以看出,
根据上节课的推导,VC Bound可以转化为
- 如果假设的成长函数
mH(N 存在break point,且数据集D 充分大,那么根据VC Bound理论,Ein(g)≈Eout(g) ,即假设具有良好的泛化能力 - 如果通过演算法从假设空间中选取一个
g ,使Ein(g)≈0 ,那么我们的算法真的可以学到东西
2 定义
- 假设集
H 最大能shatter的数据个数 - break point -1
3 举例
在数据量充分大的情况下,如果
4 2D的感知机
回顾一下之前学过的PLA算法,其实是分为两部分进行保证学习性的
- 第一部分是通过VC Bound理论,保证在数据充分大的时候,
Ein(g)≈Eout(g) - 第二部分是通过演算法PLA选取一个
g ,使Ein(g)≈0
那么就可以说明2D的感知机是可以学习的,那么多维的感知机呢?
5 感知机的VC Dimension
1维的感知机,我们知道
- 证明
dVC≥d+1 ,通过证明存在一些d+1个输入,我们可以shatter. - 证明
dVC≤d+1 ,通过证明对于所有的d+2个输入,我们都不可以shatter
证明过程参考课件,这里省略,我们可以得出结论
Physical intuition of VC Dimension
自由度
如上图所示,假设的参数产生了自由度,假设的数量和自由度是成正比的,自由度是可以调节的,可以通过控制假设的参数,一般在实践中,
一个假设的VC dimension约等于自由变量的数量。
M和dVC 的关系
在数据量
- 当
- 当
Intepreting VC Dimension
Model Complexity
根据VC Bound 理论,Bad Sample发生的概率是
进一步有
我们习惯上把根号中的内容称为模型复杂度所带来的惩罚,用
通过分析
- 当
dVC 增加的时候,Ein 会减少,但是Ω 会增加 - 当
dVC 减少的时候,Ein 会增加,但是Ω 会减少 - 如图所示,最好的
dVC 应该在中间
Sample Complexity
- 理论上来说,一般控制
N≈10000dVC ,能取得比较好的泛化性能 - 但在实践中,我们发现
N≈10dVC ,已经可以取得不错的效果
Looseness of VC Bound
从上面的数据我们可以知道,实际上VC Bound是很宽松的,为什么呢?
Hoeffding是比较宽松的,他是对于所有的数据分布,所有的目标函数
我们是对于所有的数据可能情况,求最大的
|H(x1,x2...xN)| ,即mH(N) 我们是求
NdVC ,即mH(N) 的上界我们是考虑最坏的情况,就是让演算法在假设空间中自由的选择
g
- 机器学习基石-The VC Dimension
- 机器学习基石第七讲:the vc dimension
- 机器学习基石笔记(7)——The VC Dimension
- 机器学习基石 7.4 Interpreting VC Dimension
- 台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension
- 机器学习基石——第7-8讲.The VC dimension
- 台湾国立大学机器学习基石.听课笔记(第七讲):The VC Dimension
- 机器学习基石学习笔记3 VC Dimension(1)
- 机器学习基石 7.1 Definition of VC Dimension
- 机器学习基石 7.2 VC Dimension of Perceptrons
- 机器学习基石 7.3 Physical Intuition of VC Dimension
- 机器学习基石-07-1-Definition of VC Dimension
- 机器学习基石-07-2-VC Dimension of Perceptrons
- 机器学习基石-07-3-Physical Intuition of VC Dimension
- 机器学习基石-07-4-Interpreting VC Dimension
- 【02】台大机器学习L7 The VC Dimension
- Coursera台大机器学习课程笔记6 -- The VC Dimension
- Coursera台大机器学习课程笔记6 -- The VC Dimension
- Qt_正则表达式(regular expression)
- 用 Construct 2 进行游戏设计与制作
- 【转载】eclipse中tomcat能正常启动,但是浏览器访问不了tomcat首页 问题解决
- 查看命令帮助的几种方法
- 62. Unique Paths
- 机器学习基石-The VC Dimension
- sql语句执行顺序
- CRF+FCN
- 计蒜客 跳跃游戏 贪心
- 苹果智能音箱HomePod确定跳票到2018年!元芳 你怎么看? | 精选
- linux服务器配置免密登录方法
- windows连虚拟机redis服务时遇到连接不了的情况
- 从串行线程封闭到对象池、线程池
- 合并