斯坦福公开课Machine Learning笔记(一)--Linear Regression
来源:互联网 发布:淘宝网店需要交税吗 编辑:程序博客网 时间:2024/05/01 09:00
斯坦福公开课Machine Learning笔记(一)–Linear Regression
这系列笔记其实已经手写好, 现在一次性发上来, 主要是怕丢. 内容以Andrew Ng的讲义为主,主要以公式推导与理解为主,引入和介绍省略.对于最后的Reinforcement Learning部分, 由于没有讲义以及对其实在不熟悉, 就没有笔记了(主要还是因为没有讲义).
机器学习的定义:
对于某个任务T,某个程序有了评测方法P,如果在经验E的影响下,P对T的测量结果得到了改进,那就说明程序从E中学习到了.
一.Linear Regression
- 训练集:
S={(x(1),y(1)),(x(2),y(2)),...,(x(m),y(m))} - 预测函数:
hθ(x)=θ0+θ1x
改写成向量:hθ(x)=∑i=1nθTx
其中x中增加了一项常数项1 - Lost Function:
J(θ)=12∑i=1n(hθ(x(i))−y(i))2
这里的代价函数使用的是最小二乘.(那为何是平方呢?后面会有解释)
1. Least mean squares algorithm
其中
使用梯度下降法(batch gradient descent)来最小化代价函数:
Repeat until convergence{
}
梯度下降法在机器学习中是非常常见的优化算法, 但是每次更新参数
随机梯度下降法:
Loop{
for i=1 to m{
}
}
随机梯度算法的效率会比梯度下降算法提高很多,他会在其中某几步不是向着最小误差的方向,但是总体方向是向着最小值的.然而随机梯度下降法很可能无法到达最小值,只能在最小值附近徘徊.
batch gradient descent 和minibatch gradient descent的区别其实就是在,batch是一次训练一整个训练集, 而minibatch是一次训练部分训练集.在一定程度上保证了准确性,同时提高了效率.
2.The normal equations
使用梯度下降法需要不断迭代来得到最后的参数, 而 the normal equations可以一次求出
首先把训练集向量化:
所以:
3.Probabilistic interpretation
对于线性回归中,为什么
其中
即
最大化
4.Locally weighted linear regression
在线性回归中很容易出现过拟合的现象.因为要拟合全部的样本比较难,所以可以考虑拟合局部样本:
1.
2.
其中
局部加权线性回归是非参算法,预测时需要训练集临时训练出
1 0
- 斯坦福公开课Machine Learning笔记(一)--Linear Regression
- 斯坦福公开课Machine Learning笔记(三)--Generalized Linear Models
- Stanford Machine Learning 公开课笔记(1) Linear Regression
- Stanford Machine Learning 公开课笔记(1) Linear Regression
- 斯坦福公开课Machine Learning笔记(二)--Classification and Logistic Regression
- 斯坦福公开课Machine Learning笔记(五)--Support Vector Machine
- 斯坦福公开课Machine Learning笔记(四)--Generative Learning Algorithm
- 斯坦福公开课Machine Learning笔记(六)--Learning Theory
- 斯坦福公开课Machine Learning笔记(八)--Online Learning
- 斯坦福公开课Machine Learning笔记(十一)--Factor Analysis
- 斯坦福公开课Machine Learning笔记(十二)--PCA
- 斯坦福公开课Machine Learning笔记(十三)--ICA
- 【machine learning】linear regression
- Stanford Machine Learning 公开课笔记(2) Logistic Regression
- Machine Learning—Linear Regression
- stanford machine learning, linear regression
- Machine Learning #Lab1# Linear Regression
- Machine Learning Notes - Linear Regression
- Git
- NC65主子表单据保存出错
- 编程之美
- 百度云计算部门面试
- 红黑树
- 斯坦福公开课Machine Learning笔记(一)--Linear Regression
- 淘忆项目之主页界面服务器端的修正归纳
- 知识点总结
- 去除tableview cell起始15pt的两种方法
- 1112: [POI2008]砖块Klo
- 重装win10关机不断电的解决办法
- 最佳循环&&嵌套&&数组
- Hadoop新手学习指导
- jmeter中不用time函数,用Random函数设置正确的时间格式