机器学习-学习笔记 绪论(二)

来源:互联网 发布:七天精通js 编辑:程序博客网 时间:2024/05/17 08:16

习题

习题1.1

这里写图片描述
上图中若只包含编号1和4的两个样例,试给出相应的版本空间

版本空间(version space)是概念学习中与已知数据集一致的所有假设(hypothesis)的子集集合

(色泽=青绿)∧(根蒂=∗)∧(敲声=∗)
(色泽=∗)∧(根蒂=蜷缩)∧(敲声=∗)
(色泽=∗)∧(根蒂=∗)∧(敲声=浊响)
(色泽=青绿)∧(根蒂=蜷缩)∧(敲声=∗)
(色泽=青绿)∧(根蒂=∗)∧(敲声=浊响)
(色泽=∗)∧(根蒂=蜷缩)∧(敲声=浊响)
(色泽=青绿)∧(根蒂=蜷缩)∧(敲声=浊响)
(色泽=)∧(根蒂= )∧(敲声=

习题1.2

* 若使用最多包含k个合取式的析合范式来表达1.1西瓜分类问题的假设空间, 试估计有多少种假设。*
255种(28 - 1)个,因为将上题中的版本空间的八个值,每个值取或者不取,有28种可能,但是要舍去每个都不取的情况,即28-1种。

习题1.3

这里写图片描述
先了解一下什么是数据噪声(数据噪声指在一组数据中无法解释的数据变动,就是一些不和其他数据相一致的数据)。
即,数据的某个特征,不符合正类的要求。
所以我们的归纳偏好就需要放宽,即,只要极大部分特征满足正类而极小部分不满足,这种样本仍然保存,不删除。

习题1.5

这里写图片描述
在搜索中, 用户查询为输入,搜索结果为输出, 建立输入和输出之间的联系。

原创粉丝点击