程序博客网 > mac windows支持软件

Radermacher Complexity

来源：互联网发布：mac windows支持软件编辑：程序博客网时间：2024/06/05 02:24

本文主要从理解方面入手以及各个公式之间的关系，没有证明（因为证明看了我也会忘。。）
简要概念
1. Radermacher Complexity：样本复杂性与无穷集合的可学习性之间的关系. 值：在一个函数集合中,所有函数与random noise相关性的最大值。
2. Growth function: Random Complexity 的求法是NP-hard，所以我们用Growth function 来近似他的上届。值：在一个样本集合S中，有m个样本，这m个样本被H集合中的不同函数进行分类的所有不同方式
3. VC dimension:在样本集合S中，可以被H集合中不同函数分开的最大样本数，或者有多少样本可以被H集合中的函数打散(所有样本各种标签组合H里的函数都可以正确分类)。对于一个样本S集合,函数H若所有样本都可以被打散。由于每个样本有两中选择0,1,共有2|S|中组合。所以若完全打散则H集合中的个数|H|>2|S|,所以VCdim(H)<=log2|H|.

McDiarmid’s inequality:

McDiarmid's inequality:

Hoeffding’s lemma
Hoeffding's lemma

Hoeffding inequalty

举一个例子介绍复杂度：
我们都知道过拟合的时候，在训练集上误差很小，但在测试集上误差很大太高，对每一个样本都拟合(理解就好：指泛化性能很差)的很好，这是因为分类器复杂度。为了使得在测试集上效果比较好，因此在训练时需要在训练误差和模型复杂读之间做一个权衡。

Rademacher复杂度通过计算一个函数集合(映射或分类器）对随机噪声对拟合程度来判断一个函数集合的复杂度，即
这里写图片描述
S是某一个特定样本集，G是一个函数集合。ERM是指一个函数集合在某一个样本集S上度复杂度。

在某一个分布上的集合复杂度：

这里写图片描述

Theorem 3.1说明了训练集和测试集误差的关系：
这里写图片描述

左边为测试集，右边为已知训练集。可以把g(z)当成误差函数（实际上下面证明对于loss函数公式依然成立），我们就可以知道测试集的误差上限。

阅读全文

0 0

mac windows支持软件

mac windows支持软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子漱口水喝了一点怎么办喝了一口漱口水怎么办硅胶奶嘴有味道怎么办塑料杯子有味道怎么办奶瓶有荧光剂怎么办洗衣粉有荧光剂怎么办亚视倒闭明星怎么办我想卖个手机怎么办摄像头镜片花了怎么办手机镜片破了怎么办后置摄像头有雾怎么办手机摄像头磨花怎么办手机摄像头花了怎么办 k宝初始化失败怎么办 k宝修复失败怎么办农行证书过期了怎么办农行证书已作废怎么办农行证书到期了怎么办透支卡丢了怎么办农行卡被转账怎么办农行的钱被盗怎么办浦发信用卡怎么办贷款没有工作怎么办visa卡建行理财白金卡怎么办农行短信没收到怎么办厦门e通卡怎么办北京银行卡丢了怎么办忘记农行卡号怎么办 12306客服打不通怎么办 12306电话打不通怎么办支付宝余额不对怎么办金税卡锁死怎么办金税卡开启失败怎么办手机银行被锁定怎么办怎么办网银卡和支付宝农行卡锁定了怎么办我的网银被锁了怎么办银行密码锁定了怎么办银行卡被锁定后怎么办电话银行锁了怎么办银行卡密码忘了怎么办