机器学习(周志华)习题解答1.1-1.3: 理解假设和版本空间
来源:互联网 发布:害羞知乎 编辑:程序博客网 时间:2024/06/06 05:56
说明:本文是自己对周志华 2016 年新书《机器学习》中习题的解答,难免有误欢迎指正。习题 1.4 的“没有免费的午餐定理”证明可点击这篇博文。
习题 1.1 若表 1.1 只包含 1 和 4 两个样例,试给出相应的样本空间。已知色泽有两种取值,根蒂和敲声分别有三种取值。
首先说明概念1:版本空间(version space)是概念学习中与已知数据集一致的所有假设(hypothesis)的子集集合。即是版本空间是假设空间中于样本满足一致的“假设集合”, 是基于样本决定的。
SB 是最大精确正假设边界(maximally Specific positive hypothesis Boundary)。
对于二维空间中的“矩形”假设(如图),绿色代表正例,红色代表负例。学习过程中,可以不断删除与正例不一致的假设、和(或)与反例一致的假设。最终将会获得与训练集一致(即对所有训练样本能够进行正确判断)的假设,即学得结果。如图 GB 与 SB 所围成的区域中的矩形即为版本空间。
解答:由于色泽有两种取值,根蒂和敲声分别有三种取值,再各自加上“通配”(即取什么值都无关紧要)这一项,一共是
习题 1.2 解答:刚已经分析了有 8 种取值,故假设空间中的假设用析取范式表达形式如下:
其中任意一个取值可以去掉(即去掉取值的约束,从而扩大了结果的空间),比如
好瓜↔∨((色泽=青绿)∧(根蒂=∗)∧(敲声=∗))((色泽=∗)∧(根蒂=蜷缩)∧(敲声=∗)) 也是一种假设。但不可将 8 个都去掉,这样对“好瓜”就毫无约束了,这样存在样本 4 是不符的。故包含以上 8 额合取式中任意非 0 个的析取范式表达式都是合理的假设,即共有 28−1=255 种假设。如果看到这里还没有完全理解,可以点击这里看详细列举的 49 个假设取值,然后回过头去理解题 1.1。
习题 1.3 解答:由于含有噪声,故可对样本空间放宽约束。对于那些只与极少数样本不一致却与极大多数样本一致的假设,仍将其保留在版本空间中。
- 《机器学习(周志华)》P19-习题1.1. ↩
0 0
- 机器学习(周志华)习题解答1.1-1.3: 理解假设和版本空间
- 机器学习(周志华)习题解答1.1-1.3: 理解假设和版本空间
- 机器学习#假设空间与版本空间
- 机器学习(周志华)习题解答2.1-2.9
- 机器学习(周志华) 第一章-绪论 习题解答
- 机器学习(二) - - 假设空间
- 机器学习笔记(二)假设空间
- 周志华《机器学习》版本空间
- 机器学习(周志华)习题解答-线性模型(3.1-3.10)
- 机器学习(周志华)习题解答-决策树(4.1-4.10)
- 机器学习(周志华)2.1-2.9习题解答
- 周志华《机器学习》课后习题解答系列(一):目录
- 周志华《机器学习》课后习题解答系列(二):Ch1
- 周志华《机器学习》课后习题解答系列(三):Ch2
- 周志华《机器学习》课后习题解答系列(四):Ch3
- 周志华《机器学习》课后习题解答系列(五):Ch4
- 周志华《机器学习》课后习题解答系列(六):Ch5
- 周志华《机器学习》课后习题解答系列(七):Ch6
- 6自真经出需求 - 产品经理必须看
- Linux学前硬件电路(二)1
- 全文检索
- androidStudio出现Executing tasks: [:app:assembleDebug]等错误不能运行程序
- 文章观点提取的几种测试
- 机器学习(周志华)习题解答1.1-1.3: 理解假设和版本空间
- Java内存模型——《深入理解Java虚拟机》笔记
- PCLVisualizer窗口事件注册
- 数据和C
- jquery遍历table的tr获取td的值
- jquery获取各种宽高、js的获取各种宽高及屏幕高度详解
- 基于Express框架使用POST上传文件
- c++如何将文件复制到其他地方
- 【VS开发】C++调用外部程序