机器学习(统计学习方法)6【第二章.感知机】

来源:互联网 发布:如何评价公知 知乎 编辑:程序博客网 时间:2024/06/06 02:51

Day 6

感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,为判别模型。

2.1 感知机模型


感知机模型的假设空间是定义在特征空间的所有线性分类模型,或线性分类器,即函数集合。
感知机解释有线性方程:w。x+b=0,对于特征空间一个超平面s,w是超平面的法线,b是超平面的截距,这个超平面将特征空间划分为两部分,分别为正类和负类,因此,超平面s称为分离超平面。(超平面是n维欧氏空间中余维度等于一的线性子空间。这是平面中的直线、空间中的平面之推广。
感知机学习就是利用训练数据求得w与b,再对新的数据进行判别,给出其对应的类。
2.2 感知机学习策略
对于给定的数据集,如果存在超平面S能将其全部正确地分为正实例点和负实例点,则称为数据集T具有线性可分性。
假设数据集是线性可分的,则其学习策略是能够求得其分离超平面,需定义(经验)损失函数,并将损失函数最小化。
感知机所采用的损失函数是误分类点到超平面的总距离。
误分类点:-y。(w。x+b)>0。
则:其误分类点到超平面的总距离为:


感知机学习的策略就是在假设空间中选取使损失函数最小的模型参数:w,b,即感知机模型。

原创粉丝点击