文章标题

来源:互联网 发布:吾爱免流流控源码 编辑:程序博客网 时间:2024/06/06 06:41

第一次写技术博客!主要是给自己的学习做总结。
用的是李航博士《统计学习方法》这本书。
概论:
这本书主要讲的是监督学习。目前看来监督学习主要有两块:分类问题和回归问题。
分类问题:感知机、knn、naive bayes、svm等;
回归问题:LR、logistic回归等。
第一站主要来探讨感知机和支持向量机的简单对比问题
感知机是一种很朴素的二分类的问题。利用一个平面将数据集中的点分成正反两个面。欲使得它的损失函数最小,也就是预测错误的点最少。但是这样子的话损失函数就不是连续的了,不连续则不可导。因此我们选择误分类的点到平面的距离来作为损失函数。
因此,空间中任意一点到超平面S的距离为:
s=1||w|||wx0+b|
1||w||是可以调节的,因此只需要考察后半边就行了。绝对值是用来调节正负号的,而(xi,yi)中的yi正好也是符号,因此我们只需要考察wxi+byi,使其最小化就行了。
那么对于其就是简单的最小化问题了,因此用梯度下降就可以很好的解决这个问题了!

0 0
原创粉丝点击