机器学习——监督学习(一)

来源:互联网 发布:淘宝上美瞳为什么便宜 编辑:程序博客网 时间:2024/06/05 14:53

2.1由实例学习类

类学习:寻找一个涵盖所有的正例而不涵盖任何负例的描述

类识别器的蔬菜如:对识别结果有关键影响的特征

假设类:H{所有特征值的上下界作为元素组成}

最特殊假设:S覆盖所有正例且不包含所有负例的最小矩形

最一般假设:G覆盖所有正例且不包含所有负例的最大矩形

        介于S~G之间的h均为无误差的有效假设,与训练集χ相容,这些h构成了解空间

C:实际类

边缘:h的边界和他相邻最近的实例(正例/负例)之间的差距。最大边缘:S与G中间

   误差函数在最大边缘上的最小化:不仅仅返回0、1

诱导假设:h{设定的特征值的上下界作为元素组成}

经验误差:h的预测值不同于训练集χ中给定的预期值的训练示例所占的比例

误差函数:E(h|χ) = ∑(t = 1 ~ N) 1*(h(xt)!= rt)

泛化问题:对不在训练集中的未来实例分类的准确率问题

2.2VC维

N个点,存在pow(2,N)种表现形式,如果每种形式都能被H中的一种诱导假设h打散,则称H能散列N个点

H能散列的最多个点的数量X,即为H的vc值,VC(H) = X

直线的VC值为3,因为4个点的情况下,在(2,2)的情况无法将AD,BC两对对角线的点打散

轴平行矩形的VC值为4,因为在5个点的情况下,在(4,1)的情况无法将ABCE与D打散

VC值度量的是假设类H的学习能力

2.3

阅读全文
0 0
原创粉丝点击