线性回归

来源:互联网 发布:linux cron命令每周三 编辑:程序博客网 时间:2024/06/08 08:54

最小二乘法线性回归模型

模型

yiw0+j=1dxijwj

模型学习

平方误差损失
wLS=argminwi=1n(yif(xi;w))=argminwL

最小二乘法解(矩阵版本)

L=i=1n(yixTiw)2=||yXw||2=(yXw)T(yXw)

对w求导
wL=2XTXw2XTy=0wLS=(XTX)1XTy

潜在问题

计算wLS=(XTX)1XTy架设了(XTX)1存在
什么时候(XTX)1不存在?
(XTX)1不是满纸矩阵的时候。
什么时候(XTX)1是满秩的?
n×(d+1)矩阵X有至少d+1线性无关的行时。这说明任意一个样本都能通过X中的d+1行的线性组合得到。
显然,当n<d+1时,不能使用最小二乘法。如果(XTX)1不存在,会存在无穷多解。
结论:希望n>>d,(i.e. X 矩阵高且瘦)

几何解释

yXwLS为一个正交于y^的误差向量。
线性回归的任务就是在d+1维子空间上找到一个预测向量y^使得目标向量y和预测向量y^的差向量的模的平方最小。
根据几何知识可知,当预测向量y^为原始向量y在子空间上的正交投影时,差向量的模最小。
这里写图片描述
这里写图片描述

概率解释

假设线性回归的噪音ϵi=yixTiw
互相独立且满足高斯分布
也就是说

1.yϵi2.yi3.y=xTiw+ϵi,(i.i.d)N(0,σ2)i=1,...,n(i.i.d)N(xTiw,σ2)i=1,...,nN(Xw,σI)

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

Ridge

原创粉丝点击