台大林轩田《机器学习基石》学习笔记:线性模型一(PLA/pocket、Linearregression )
来源:互联网 发布:yum下载 编辑:程序博客网 时间:2024/06/02 06:30
本文是作者学习台大林轩田教授《机器学习基石》课程后整理的简要笔记(未按课程回目分节),内容大部分来源于林轩田教授的课程资料,其余相关参考链接已标出。
版权所有:CSDN博客 拖延症患者的自愈小记
线性模型 - Linear models
举个例子引入,银行发放信用卡问题。银行掌握了某顾客的资料,包括年龄、性别、年薪、年工作时间、信用贷款等等,现在银行需要知道:
要不要发信用卡给该顾客?——Binaryclassification y=0/1
给该顾客多少信用额度?——Linear regression y∈R
该顾客透支信用额度无法还款的可能性有多大?——Logistic regression y∈[0,1]
- PLA/pocket
For binary classification解决是非问题
Perceptron是二类线性分类模型:输入向量X的每一个分量都对应一个权重w(也就是每个因素对最后输出的重要程度),线性组合后得到一个score,根据设定的阈值输出y,即score大于阈值y取+1,小于阈值y取-1
Perceptron learning algorithm是训练出最佳Perceptron的方法,也就是得到使 Ein(w)min的w:由一组样本训练出可将所有样本点正确分类的Perceptron,思路是由一个初始分类(二维是直线)开始,寻找这个分类分错的样本点,修正该分类(线向该点方向偏移),直至找不出错误分类样本点
PLA是迭代的过程,若训练样本线性可分,则PLA能够停下来(可证);若不是线性可分,这就是一个NP-hard问题,一个解决方法是pocket口袋算法,每次迭代比较口袋里和手里的分法,将较好的放在pocket里暂存,直至循环次数足够多停止,这样比较贪心的得到一个不错的w
参考:http://blog.csdn.net/bingduanlbd/article/details/24468885
- Linearregression 线性回归
与二值分类问题相比,线性回归过程省去了阈值判断步骤:输入向量X的每一个分量都对应一权重w,线性组合后得到一个结果,直接将score作为y值输出,求最佳权重向量w
线性回归通常用squared error作为错误衡量,回归过程也就是寻找w(直线/平面/超平面),使得输入数据的残差最小的过程;由于Ein(w)是连续可微的凸函数,求解其微分为零的点找到曲线的“谷底”,且式子直接可解,于是“一步登天”得到解
- 台大林轩田《机器学习基石》学习笔记:线性模型一(PLA/pocket、Linearregression )
- 台大林轩田《机器学习基石》学习笔记5:线性模型一(PLA/pocket、Linearregression )
- 机器学习基石 作业1 实现PLA和Pocket算法
- 机器学习基石学习笔记(1)-PLA
- 机器学习基石作业一PLA算法
- Coursera课程-机器学习基石作业一Q18-Q20(pocket on D算法 for PLA/C++ edition)
- 台大林轩田《机器学习基石》学习笔记:线性模型二(Logistics regression)
- 台大林轩田《机器学习基石》学习笔记:线性模型三(Multiclass Prediction)
- 台大林轩田《机器学习基石》学习笔记6:线性模型二(Logistics regression)
- 台大林轩田《机器学习基石》学习笔记7:线性模型三(Multiclass Prediction)
- PLA(Perceptron Learning Algorithm)--机器学习基石笔记
- 机器学习PLA&Pocket algorithm实现(python)
- 林轩田机器学习基石观后笔记——感知器学习(PLA)
- 机器学习基石第一讲:PLA
- 机器学习基石 2.3 Guarantee of PLA
- 机器学习基石 2.4 More about PLA
- 机器学习基石---第二周PLA
- 机器学习(3)线性回归sklearn.linear_model.LinearRegression
- 站内信的实现:数据库的设计
- Oracle并行基础一
- 通过euclidean_distances计算向量之间的距离
- C# web 后台页面间的跳转
- Eclipse ADT插件安装
- 台大林轩田《机器学习基石》学习笔记:线性模型一(PLA/pocket、Linearregression )
- linux下(ubuntu),段错误产生的原因Segmentation Fault
- 数据库里有数据但是python取出来发现是空的
- Egret常用第三方类库
- Oracle并行基础二
- java常用算法之返回字符串中目标字符串的位置
- cocos2d坐标转换
- java集合-TreeSet
- cout << fixed,precision,ios_base