最小二乘法

来源：互联网发布：知乎抑郁症阅读障碍编辑：程序博客网时间：2024/06/07 05:04

最小二乘法

对于一元线性回归模型, 假设从总体中获取了n组观察值（X1，Y1），（X2，Y2）， …，（Xn，Yn）。对于平面中的这n个点，可以使用无数条曲线来拟合。要求样本回归函数尽可能好地拟合这组值。综合起来看，这条直线处于样本数据的中心位置最合理。选择最佳拟合曲线的标准可以确定为：使总的拟合误差（即总残差）达到最小。

有以下三个标准可以选择：

（1）用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。

（2）用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。

（3）最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外，得到的估计量还具有优良特性。这种方法对异常值非常敏感。

简单地说，最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小.

这里的“二乘”指的是用平方来度量观测点与估计点的远近（在古汉语中“平方”称为“二乘”），

“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。

从这个上也可以看出，最小二乘也可用于拟合数据模型。

这当中涉及到如下问题：
①观测点和距离点的距离：这个距离也被称为误差。既然要估计，总希望找到最好的估计值，那么误差越小越好。
②为什么是距离的平方和：距离的平方和也就是误差的平方和，既然误差越小越好，那是否可以用绝对值来代替？；楼主觉得用绝对值代替的这个想法是可以的，只是在之后的运算求值时处理比较复杂。（楼主隐约记得取绝对值最小的方法好像是最小一乘法）
③为什么平方求解方便呢？

5 0