最小二乘法拟合曲线

来源:互联网 发布:返利系统源码 编辑:程序博客网 时间:2024/04/28 06:46

最小二乘法

维基百科,自由的百科全书
线性代数
\mathbf{A} = \begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}
向量 · 矩阵  · 行列式  ·线性空间显示▼向量显示▼矩阵与行列式显示▼线性空间与线性变换
      

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。

利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

最小二乘法还可用于曲线拟合。

其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。

人们对由某一变量t 或多个变量t1……tn 构成的相关变量y感兴趣。如弹簧的形变与所用的力相关,一个企业的盈利与其营业额,投资收益和原始资本有关。为了得到这些变量同y之间的关系,便用不相关变量去构建y,使用如下函数模型

y_m = f(t_1,\dots, t_q;x_1,\dots,x_p),

q个相关变量或p个附加的相关变量去拟和。

通常人们将一个可能的、对不相关变量t的构成都无困难的函数类型充作函数模型(如抛物线函数或指数函数)。参数x是为了使所选择的函数模型同观测值y相匹配。(如在测量弹簧形变时,必须将所用的力与弹簧的膨胀系数联系起来)。其目标是合适地选择参数,使函数模型最好的拟合观测值。一般情况下,观测值远多于所选择的参数。

其次的问题是怎样判断不同拟合的质量。高斯和勒让德的方法是,假设测量误差的平均值为0。令每一个测量误差对应一个变量并与其它测量误差不相关(随机无关)。人们假设,在测量误差中绝对不含系统误差,它们应该是纯偶然误差,围绕真值波动。除此之外,测量误差符合正态分布,这保证了偏差值在最后的结果y上忽略不计。

确定拟合的标准应该被重视,并小心选择,较大误差的测量值应被赋予较小的权。并建立如下规则:被选择的参数,应该使算出的函数曲线与观测值之差的平方和最小。用函数表示为:

 \min_{\vec{x}} { \sum_{i=1}^{n}(y_m - y_i)^2} .

用欧几里得度量表达为:

 \min_{ \vec{x} } \| \vec{y}_{m} ( \vec{x} ) - \vec{y} \|_{2} \ .

最小化问题的精度,依赖于所选择的函数模型。

典型的一类函数模型是线性函数模型。最简单的线性式是y = x0 + x1t,写成行列式,为

 \min_{x_0,x_1}\left\|\begin{pmatrix}1 & t_1 \\ \vdots & \vdots \\ 1 & t_n  \end{pmatrix} \begin{pmatrix} x_0\\ x_1\end{pmatrix} - \begin{pmatrix} y_1 \\ \vdots \\ y_{n}\end{pmatrix}\right\|_{2} = \min_x\|Ax-b\|_2.

直接给出该式的参数解:

x_1 = \frac{\sum_{i=1}^n t_iy_i - n \cdot \bar t \bar y}{\sum_{i=1}^n t_i^2- n \cdot (\bar t)^2} 和 x_0 = \bar y - x_1 \bar t

其中\bar t = \frac{1}{n} \sum_{i=1}^n t_i,为t值的算术平均值。也可解得如下形式:

x_1 = \frac{\sum_{i=1}^n (t_i - \bar t)(y_i - \bar y)}{\sum_{i=1}^n (t_i - \bar t)^2}

[编辑]简单线性模型 y = x0 + x1t 的例子

随机选定10艘战舰,并分析它们的长度与宽度,寻找它们长度与宽度之间的关系。由下面的描点图可以直观地看出,一艘战舰的长度(t)与宽度(y)基本呈线性关系。

以下图表列出了各战舰的数据,随后步骤是采用最小二乘法确定两变量间的线性关系。

编号长度 (m)宽度 (m)ti - tyi - y   itiyiti*yi*t*y*t*t*y*y*120821.640.23.19128.2381616.0410.1761215215.5-15.8-2.9145.978249.648.4681311310.4-54.8-8.01438.9483003.0464.1601422731.059.212.59745.3283504.64158.5081513713.0-30.8-5.41166.628948.6429.2681623832.470.213.99982.0984928.04195.7201717819.010.20.596.018104.040.3481810410.4-63.8-8.01511.0384070.4464.1601919119.023.20.5913.688538.240.34811013011.8-37.8-6.61249.8581428.8443.6921总和(Σ)1678184.10.00.003287.82020391.60574.8490


仿照上面给出的例子

\bar t = \frac {\sum_{i=1}^n t_i}{n} = \frac {1678}{10} = 167{.}8 并得到相应的\bar y = 18{.}41.

然后确定x1

x_1 = \frac{\sum_{i=1}^n (t_i- \bar {t})(y_i - \bar y)}{\sum_{i=1}^n (t_i- \bar t)^2}
 = \frac{3287{.}820} {20391{.}60} = 0{.}1612 \;,

可以看出,战舰的长度每变化1m,相对应的宽度便要变化16cm。并由下式得到常数项x0

x_0 = \bar y - x_1 \bar t = 18{.}41 - 0{.}1612 \cdot 167{.}8 = -8{.}6394\;,

在这里随机理论不加阐述。可以看出点的拟合非常好,长度和宽度的相关性大约为92%。

[编辑]一般线性情况

若含有更多不相关模型变量t1,...,tq,可如组成线性函数的形式

y(t_1,\dots,t_q;x_0, x_1, \dots, x_q )= x_0 + x_1 t_1 + \cdots + x_q t_q

即线性方程组

 \begin{matrix}x_0 + x_1 t_{11} + \cdots + x_j t_{1j}+ \cdots +x_q t_{1q} = y_1\\x_0 + x_1 t_{21} + \cdots + x_j t_{2j}+ \cdots +x_q t_{2q} = y_2\\\vdots \\x_0 + x_1 t_{i1} + \cdots + x_j t_{ij}+ \cdots +x_q t_{iq}= y_i\\\vdots\\x_0 + x_1 t_{n1} + \cdots + x_j t_{nj}+ \cdots +x_q t_{nq}= y_n\end{matrix}

通常人们将tij记作数据矩阵 A,参数xj记做参数矢量x,观测值yi记作b,则线性方程组又可写成:

 \begin{pmatrix}1 & t_{11} & \cdots & t_{1j} \cdots & t_{1q}\\1 & t_{21} & \cdots & t_{2j} \cdots & t_{2q}\\\vdots \\1 & t_{i1} & \cdots & t_{ij} \cdots & t_{iq}\\\vdots\\1 & t_{n1} & \cdots & t_{nj} \cdots & t_{nq}\end{pmatrix}\cdot\begin{pmatrix}x_0\\x_1\\x_2\\\vdots \\x_j\\\vdots\\x_q\end{pmatrix}=\begin{pmatrix}y_1\\y_2\\\vdots \\y_i\\\vdots\\y_n\end{pmatrix} 即 Ax = b

上述方程运用最小二乘法导出为线性平差计算的形式为:

\min_x\|Ax-b\|_2

[编辑]最小化问题的解

① 一次函数使用polyfit(x,y,1)
  ②多项式函数使用 polyfit(x,y,n),n为次数
  拟合曲线
  x=[0.5,1.0,1.5,2.0,2.5,3.0],
  y=[1.75,2.45,3.81,4.80,7.00,8.60]。
  解:MATLAB程序如下:
  x=[0.5,1.0,1.5,2.0,2.5,3.0];
  y=[1.75,2.45,3.81,4.80,7.00,8.60];
  p=polyfit(x,y,2)
  x1=0.5:0.05:3.0;
  y1=polyval(p,x1);
  plot(x,y,'*r',x1,y1,'-b')
  计算结果为:
  p =0.5614 0.8287 1.1560
  即所得多项式为y=0.5614x^2+0.08287x+1.15560
  ③非线性函数使用 lsqcurvefit(fun,x0,x,y)
原创粉丝点击