台湾大学机器学习基石Lecture4
来源:互联网 发布:视频管理系统php 编辑:程序博客网 时间:2024/05/22 08:21
4-1:Feasibility Of Learning
机器学习的可行性,可能有一个很upset的事情是机器学习可能是不行的,为什么?因为你能确保在数据Data中g满足要求,但是数据外或者进行预测呢?g可能和实际的f差很远。
4-2:Probability to the rescue
补救是有可能性的。
在概率论与数理统计中中,我们做过用样本估计总体的试验,假设有一罐球,如下图所示:
罐子里有绿色和橙色两种玻璃球,假设橙色球的比例是u,那么绿色球的比例肯定是1-u,那么我们如何确定u的数值大小呢?
我们从罐子里取出一堆球,统计橙色球的比例并记为v,那么我们可以用v来近似代替u,因为罐子是被搅拌过的,随机抽取的球满足一般性,可以用样本估计总体。
或者从另外一个角度,即由Hoeffding’s Inequality(霍夫丁不等式)来定量的进行分析。公式如下:
从公示可以看出,随着样本数目N的增多,p变得越来越小,随着
4-3:Connection to Learning
上一节中罐子小球和机器学习的关系对比如下表:
由对比可以看出,
我们引入两个记号
4-4:Connection to Real Learning
通过第三节,我们可以用
我们以抛硬币为例进行说明,假设有150个人抛硬币,每个人连续抛5次,则一个人抛到5次正面的概率是
Hoeffding’s Inequality告诉我们的是抽到坏数据的概率很小,如下图中:
如果单个假设来看,抽到坏数据的可能性确实特别小,但是当hypothesis增多时,就像150个人抛硬币,最后抽到一个人5次正面朝上的概率>0.99,下面计算一下这个概率:
因此,如果|H|=M有限且N足够大的情况下,可以确保无论哪个空间都有
- 台湾大学机器学习基石Lecture4
- 台湾大学机器学习基石Lecture2
- 台湾大学机器学习基石Lecture3
- 台湾大学机器学习基石Lecture5
- 台湾大学机器学习基石Lecture6
- 台湾大学机器学习基石Lecture7
- 台湾大学机器学习基石Lecture8
- 台湾大学机器学习基石Lecture9
- 台湾大学机器学习基石Lecture10
- 台湾大学机器学习基石Lecture11
- 台湾大学机器学习基石Lecture12
- 《机器学习基石》课堂原文Lecture4-1
- 台湾大学林轩田老师机器学习基石:内容简介
- 台湾大学机器学习基石笔记整理
- 台湾大学机器学习基石lecture1小结
- 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization
- 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation
- 台湾大学林轩田机器学习基石课程学习笔记
- Intel芯片架构中TEE的实现技术之SGX初探
- 手动升级ubuntu openssh-server
- 【51nod】1101 换零钱
- Mac下查看node等的安装路径
- 小白成长之路(1)--应用CSS之前的必须看懂的代码
- 台湾大学机器学习基石Lecture4
- 洛谷P1092 虫食算(回溯法)
- 学习笔记 Linux 启动logo修改
- 替换空格 (剑指Offer 第 2 题)
- 移动端效果之swiper
- WEB服务器、应用程序服务器、HTTP服务器有何区别
- 加载网络图片
- Window10企业版激活
- qbxt国庆水题记day5