线性回归Linear Regression-模型和参数求解

来源：互联网发布：java线程通信方式编辑：程序博客网时间：2024/06/14 21:56

训练集共m个样本，第i个样本(x(i),y(i)),x(i)=(x(i)1,x(i)2,...,x(i)d)T，即有d维特征。

线性回归模型

h(x)=w1x1+w2x2+...+wdxd+b

解析法求解参数：对cost function求导，令导数为0，求得参数。

简单情况举例
输入只有一维特征y=wx+b，优化目标minimizeJ(w,b)=J(w,b)=12m∑mi=1(wx(i)+b−y(i))2
求导
${\partial \partial w J (w, b) = 1 m \sum m i = 1 (w x (i) + b - y (i)) x (i) \partial \partial b J (w, b) = 1 m \sum m i = 1 (w x (i) + b - y (i))$
令导数为0，求得
$⎧ ⎩ ⎨ ⎪ ⎪ w = \sum m i = 1 ( y ( i ) - b ) x ( i ) \sum m i = 1 x ( i ) 2 b = \sum m i = 1 ( y ( i ) - w x ( i ) ) m$
通常情况，多维特征
m个样本，d维特征。为了计算简便，通常把w,b统一起来，给x增加一列1，b作为w0，如下：

则
$J (w) = 1 2 m (X W - Y) 2 = 1 2 m (X W - Y) T (X W - Y)$
求导
$\partial \partial w J (w) = = 1 2 m (X W - Y) T (X W - Y) 1 2 m (X T X W - X T Y)$
令导数等于0，得到
$W = (X T X) - 1 X T Y$
n*n矩阵求逆运算的时间复杂度是O(n3)。(XTX)是（d+1）*（d+1）维，所以当特征维数d很大时，计算将花费很长时间。

这里写图片描述
一般，当特征维数小于10000时，正规方程计算是一个很好的方法，当特征维数多于10000时，通常采用梯度下降方法。
像线性回归这样简单的模型可通过对损失函数求导，令导数为0，解得最优解所对应的参数。但对复杂的模型来说，求导过程可能相当复杂，只能用梯度下降法不断向最优解处逼近。

1.Andrew Ng的Machine Learning课程
2.《机器学习》周志华
3.http://blog.csdn.net/stdcoutzyx/article/details/9101621

阅读全文

0 0