Stanford公开课机器学习---week2-1.多变量线性回归 (Linear Regression with multiple variable)
来源:互联网 发布:中国网络电视在线大全 编辑:程序博客网 时间:2024/04/28 01:14
3.多变量线性回归 (Linear Regression with multiple variable)
3.1 多维特征(Multiple Features)
- n 代表特征的数量
x(i) 代表第 i 个训练实例,是特征矩阵中的第 i 行,是一个向量(vector)。x(i)j 代表特征矩阵中第 i 行的第 j 个特征,也就是第 i 个训练实例的第 j 个特征。
多维线性方程:
hθ=θ0+θ1x+θ2x+...+θnx
这个公式中有 n+1 个参数和 n 个变量,为了使得公式能够简化一些,引入
多维线性方程 简化为:
hθ=θTX
3.2 多变量梯度下降(Gradient descent for multiple variables)
cost function :
J(θ)=12m∑1m(hθ(x(i))−y(i))2
在 Octave 中,写作: J = sum((X * theta - y).^2)/(2*m);梯度下降公式:
θj:=θj−α∂∂θjJ(θ0,θ1) =θj−α1m∑1m((hθ(x(i))−y(i))⋅x(i)j)
在 Octave 中,写作:
theta=theta−alpha/m∗X′∗(X∗theta−y);
3.3 特征缩放(feature scaling)
以房价问题为例,假设我们使用两个特征,房屋的尺寸和房间的数量,尺寸的值为 0- 2000 平方英尺,而房间数量的值则是 0-5,绘制代价函数的等高线图,看出图像会显得很扁,梯度下降算法下降的慢,而且可能来回震荡才能收敛。
mean normalization
解决的方法是尝试将所有特征的尺度都尽量归一化到-1 到 1 之间。最简单的方法是令
其中 
3.4 学习率(Learning rate)
- 确保梯度下降working correctly
绘制迭代次数和代价函数的图表来观测算法在何时趋于收敛。下降说明正常
若增大或来回波动,可能是
2.如何选取
先在10倍之间取,找到合适的区间后,在其中再细化为3倍左右(log)
We recommend trying values of the learning rate α on a log-scale, at multiplicative steps of about 3 times the previous value
α=…,0.001,0.01,0.1,1,…
α=…,0.001,0.03,0.01,0.03,0.1,0.3,1,…
3.5 多项式回归(Features and Polynomial Regression)
房价预测问题
已知x1=frontage(临街宽度),x2=depth(纵向深度),则
若用 x=frontage*depth=area(面积),则
线性回归并不适用于所有数据,有时我们需要曲线来适应我们的数据,比如一个二次方模型或三次方模型(考虑到二次方程的话总会到最高点后随着size↑,price↓,不合常理;因此选用三次方程进行拟合更合适。):
或采用第二个式子:
特征归一化很重要,使得不同feature之间有可比性
3.6 正规方程(Normal Equation)
之前用梯度下降算法,但是对于某些线性回归问题,正规方程方法更好。
要找到使cost function
X是m×(n+1)的矩阵,y是m×1的矩阵,正规方程(Normal Equation):
θ=(XTX)−1XTy
在 Octave 中,正规方程写作:
pinv(X′∗X)∗X′∗y
注:对于那些不可逆的矩阵(通常是因为特征之间不独立,或特征数量大于训练集的数量),正规方程方法是不能用的。
3.7 练习
- Stanford公开课机器学习---week2-1.多变量线性回归 (Linear Regression with multiple variable)
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第2讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
- Stanford机器学习---第二讲. 多变量线性回归Linear Regression with multiple variables
- 机器学习 Machine Learning(by Andrew Ng)----第三章 多变量线性回归(Linear Regression with multiple variable)
- Coursera公开课笔记: 斯坦福大学机器学习第四课“多变量线性回归(Linear Regression with Multiple Variables)”
- Coursera公开课笔记: 斯坦福大学机器学习第四课“多变量线性回归(Linear Regression with Multiple Variables)”
- iOS使用WebView查看各类文档
- 栈
- 使用ImageROI来增加某范围的像素
- win7下android studio1.2安装以及出错问题解决方式汇总
- JSON的操作
- Stanford公开课机器学习---week2-1.多变量线性回归 (Linear Regression with multiple variable)
- 技术知识图
- c++11 内存模型解读
- SQLSERVER2008导出数据错误 无法在只读列中插入数据
- UITableView---分组 省份城市列表+ 右列索引
- android、ios与服务器端php使用rsa加密解密通讯
- Android-Mac电脑如何进行APK反编译-使用apktool、jd-gui
- JavaScript特效实例017-慢慢放大的窗口
- SQLSERVER如何获取一个数据库中的所有表的名称、一个表中所有字段的名称