林轩田之机器学习课程笔记(when can machines learn之feasibility of learning)(32之4)
来源:互联网 发布:php权限管理建表思路 编辑:程序博客网 时间:2024/04/27 13:46
- 概要
- 机器学习是做不到的
- 通过概率来拯救机器学习
- 概率和机器学习的联系
- 概率和真实机器学习的联系
欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen
概要
上节课讲到了机器学习各种各样的类型,本节课会介绍机器学习到底是否可行。
机器学习是做不到的?
举一个简单例子,如下图
这就是最简单的智力测试之类的题目,一般考公务员还有这样的题目,哈哈哈哈。
回归正题,那么给到下面的图片,到底是 +1 还是-1?
如果你的答案是+1,哈哈哈,你答错了,其实是-1。因为-1的左上角都是黑色,而给定的图片左上角也是黑色,所以是-1。
如果你的答案是+1,哈哈哈,你答错了,其实是+1。因为+1的都是对称的,给定的图片是对称的。所以是+1。
所以是不是懵逼了,哈哈哈。这样看是不是机器学习是没用用的?
这里再举一个简单例子进行说明。如上图,假设给定5条数据,每条数据都有三个维度,分别用0和1表示。同时给定该条数据的标签。那么我们能够根据这六条数据学习到东西呢?就是我们需要怎么知道那个
我们知道,在给定的x中包含三个维度,每个维度只有两种可能,这样x其实最多只有八条记录。2*2*2=8。
同时我们的假设空间
如果我们从这256种假设中,选取一些假设,使得完全满足我们给定的资料信息,那么这样的假设
那么这样我们知道了8种
这个就是天下没有免费的午餐理论。因为我们不知道
所以,在我们不提供任何假设,在不知道
通过概率来拯救机器学习
由于我们假设了
比如给你一个大大的罐子,罐子里面有很多弹珠,要来估计弹珠里面的比例。如果我们对罐子一无所知,根据上面的结论,这个是没法做到的。如下图
假设罐子里面实际橙色的概率是:
那么
霍夫丁不等式告诉我们,
根据公式
当我们抽取的样本越多,u和v就越接近。
当我们的设定
所以N越大,
霍夫丁不等式只是给定
概率和机器学习的联系
那么上面的霍夫丁不等式怎么联系到机器学习呢?我们可以对照下两边的关系:
假设大罐子里面的弹珠就是一个个的样本。整个大罐子就是输入空间
1)罐子里的橙色弹珠的概率
2)罐子里的弹珠————机器学习的输入空间
3)找到一个固定的
4)绿色的弹珠————正确的概率。
5)抽取的样本量————资料量的大小。
换一种简单的描述:
如果
所以就通过概率和机器学习联系起来了
整个流程可以表示如下:
黄色的线条就是在原有的基础上添加的。虚线表示不知道的过程,实线表示已知的过程。
这里
我们在做学习的时候,核心就是在未知的资料中,使我们的
根据霍夫丁不等式我们有:
所以就可以通过在已知的数据得到错误率去估计未知数据的错误率。
机器学习是要从一个
概率和真实机器学习的联系
上面讲到了固定的一个
同样适用弹珠作为例子:
现在有很多
用铜板的例子讲讲,假设有150个人同时丢铜板,丢了5次,那么这个时候有一人的铜板连续5次出现正面,那么是否认为这个铜板牛逼呢,还是这个人运气好?
我们计算下:
就像那个铜板,实际的
霍夫丁告诉我们,对于一个固定的
当存在很多的
那么出现坏资料的概率就是:
就像扔了150个人同时扔铜板,基本总是有一个人会出现连续出现正面向上。
这样在有限的
所以这样就证明机器学习是可行的。
但是我们的假设空间一般都会无限的的,比如,PLA,是整个直线组成的线性空间。那么怎么证明是可以学习的呢?
下节课讲解。
欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen
- 林轩田之机器学习课程笔记(when can machines learn之feasibility of learning)(32之4)
- 林轩田之机器学习课程笔记(when can machines learn之types of learning)(32之3)
- 林轩田之机器学习课程笔记(when can machines learn之learning problem)(32之1)
- 林轩田之机器学习课程笔记(when can machines learn之learning to answer yes or no)(32之2)
- 林轩田之机器学习课程笔记(why can machines learn之theory of generalization)(32之6)
- 林轩田之机器学习课程笔记(why can machines learn之training versus testing)(32之5)
- 林轩田之机器学习课程笔记(why can machines learn之the VC dimension)(32之7)
- 林轩田之机器学习课程笔记(why can machines learn之noise and error)(32之8)
- 林轩田之机器学习课程笔记( how can machines learn之linear regression)(32之9)
- 台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning
- Feasibility of Learning & Training versus Test(林轩田-机器学习)
- 机器学习基石-Feasibility of Learning
- 机器学习演算法 第四讲 Feasibility of Learning——学习笔记k
- 机器学习基石第四讲:feasibility of learning
- coursera机器学习笔记之“Support Vector Machines(SVMs)”
- Andrew Ng机器学习课程笔记(四)之神经网络
- Tang机器学习课程笔记之六(Numpy库)
- Andrew NG机器学习课程笔记系列之——Introduction to Machine Learning
- mvc iis设置默认首页无效
- Android 普通View截图 RecyclerView截图 ScrollView截图分享
- Student类作为泛型的应用
- 剑指offer---替换空格
- Hadoop视频大汇总
- 林轩田之机器学习课程笔记(when can machines learn之feasibility of learning)(32之4)
- 字符版本贪吃蛇游戏的多种不同算法
- javascript三大家族之offset
- python + tesseract OCR 文字识别
- 关于dllMain死锁的问题
- 数据结构实验之查找七:线性之哈希表
- [51Nod 1587] 半现串
- Ubuntu 升级内核 以及 开启BBR
- c指针