机器学习——感知机总结
来源:互联网 发布:mac输入法 u 编辑:程序博客网 时间:2024/06/06 05:23
在机器学习中,感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征向量,输出为实例的类别(取+1和-1)。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面,为求得超平面导入了基于误分类的损失函数,利用梯度下降法 对损失函数进行最优化(最优化)。感知机的学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用学习得到的感知机模型对新的实例进行预测的,因此属于判别模型。
定义
假设输入空间(特征向量)为
称为感知机。其中,参数w叫做权值向量weight,b称为偏置bias。
sign为符号函数,即
在二分类问题中,
线性分类器的几何表示有:直线、平面、超平面。
学习策略
核心:极小化损失函数。
如果训练集是可分的,感知机的学习目的是求得一个能将训练集正实例点和负实例点完全分开的分离超平面。为了找到这样一个平面(或超平面),即确定感知机模型参数w和b,我们采用的是损失函数,同时并将损失函数极小化。
对于损失函数的选择,我们采用的是误分类点到超平面的距离(可以自己推算一下,这里采用的是几何间距,就是点到直线的距离):
其中
对于误分类点
误分类点到超平面的距离为:
那么,所有点到超平面的总距离为:
不考虑
其中M为误分类的集合。这个损失函数就是感知机学习的经验风险函数。
可以看出,随时函数
学习算法
感知机学习转变成求解损失函数
梯度下降其实是局部最优。感知机学习算法本身是误分类驱动的,因此我们采用随机梯度下降法。首先,任选一个超平面
极小化过程不是一次使M中所有误分类点的梯度下降,而是一次随机的选取一个误分类点使其梯度下降。使用的规则为
然后,随机选取一个误分类点,根据上面的规则,计算新的
其中
算法描述如下:
算法:感知机学习算法原始形式
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
解释:当一个实例点被误分类时,调整w,b,使分离超平面向该误分类点的一侧移动,以减少该误分类点与超平面的距离,直至超越该点被正确分类。
实例
正样本点:
负样本点:
求感知机模型
解答思路:根据上面讲解的,写初始化权值w和偏置b,然后一步一步的更新权值,直到所有的点都分正确为止。
解:
(1) 令
(2) 随机的取一个点,如
计算得到
得到一个模型
(3)接着继续,计算各个点是否分错,通过计算得到,
得到线性模型:
一次下去,知道所有的点都有
……
……
……
最后求得
所以感知机模型为:
即我们所求的感知机模型。
小结
感知器Perceptron在机器学习当中是相当重要的基础,理解好感知器对后面的SVM和神经网络都有很大的帮助。事实上感知器学习就是一个损失函数的最优化问题,这里采用的是随机梯度下降法来优化。
- 机器学习——感知机总结
- 机器学习—感知机
- 机器学习——感知机学习
- 机器学习——简单感知机
- 机器学习实战——感知机
- 机器学习算法——感知机
- 浅谈机器学习——感知机
- 机器学习总结系列(二)——感知机模型
- 机器学习笔记——感知机算法的几点总结
- 机器学习 - 感知机
- 机器学习 ---感知机
- 统计机器学习笔记——感知机(1)
- 机器学习笔记(2)——感知机
- 机器学习算法——感知机(Python源码)
- 机器学习——感知机(笔记+代码)
- 机器学习——感知机与神经网络
- 机器学习算法(分类算法)—Rosenblatt感知机
- 机器学习总结2_感知机算法(PLA)
- jQuery插件开发精品教程,让你的jQuery提升一个台阶
- 美团2017校招-最长公共连续子串
- 配置完xadmin源码包后启动报错“ Apps aren't loaded yet.”
- 1001. A+B Format (20)
- 没钱的时候,我们可以先做好这些投资
- 机器学习——感知机总结
- 线段树
- 同步更新2个blog
- (转载)TCP与UDP最全区别
- 操作系统
- Android Webview优化及与Js交互
- 二、JDBC——数据库链接和创建
- 一个简单的SpringMVC实例
- html行内元素和块级元素的区别