PRML读书笔记（1）——第三章线性回归模型

来源：互联网发布：linux 源码安装lnmp 编辑：程序博客网时间：2024/06/01 13:16

线性基函数模型
- 基本形式
- Feature Extraction
- 最大化似然函数和最小均方差Maximum likelihood and least squares
  - Example

线性基函数模型

y (x, w) = w 0 + w 1 x 1 + \dots + w D x D = w 0 + \sum j = 1 M - 1 w j ϕ j (x) = \sum j = 0 M - 1 w j ϕ j (x) = w T ϕ (x)

决定基函数（basis function）{ϕj(x)}的过程，基函数选取可以包括

讨论最大似然方法和最小均方差的关系

t = y (x, w) + ϵ

其中

ϵ是均值为0的高斯随机值，精度为

β(后面很多地方用到这个参数，其含义是数据的随机精度，是由数据本身确定的，在机器学习的过程中只能不断的去迫近这个值)。即有目标值概率密度函数符合高斯分布

p (t | x, w, β) =  (t | y (x, w, β - 1))

一般来说，如果用均方差函数，那么关于

t的最优预测结果是分布的均值，对于上面的式子，其条件均值为

E [t | x] = \int t p (t | x) d t = y (x, w)

Input values: X={x1,⋯,xN}, t={t1,⋯,tN}是从上面的高斯随机分布中产生的数据，得到下面的似然函数

p (t | X, w, β) = \prod n = 1 N ln  (t n | w T ϕ (x n), β - 1)

是对于整个训练数据的目标值的概率分布密度函数，忽略条件参数中的

X并且取对数得到对数似然函数

ln p (t | w, β) = \sum n = 1 N ln  (t n | w T ϕ (x n), β - 1) = N 2 ln β - N 2 ln (2 π) - β E D (w)

其中的

ED(w)是均方误差函数

E D (w) = 1 2 \sum n = 1 N {t n - w T ϕ (x n)} 2

可以通过最大似然函数的方法去估计参数

w和

β，已知在高斯噪声的假设下(也就是说正常情况下最大化似然函数所覆盖的范围是比最小化均方差大的)，最大化似然函数等同于最小化均方差函数

ED(w)。首先求对数似然函数关于

w的梯度为

\nabla ln p (t | w, β) = \sum n = 1 N {t n - w T ϕ (x n)} ϕ (x n) T = 0

存疑：这里涉及到矩阵求导，貌似上式中最后一项

Φ(xn)T是采取了分子布局的结果，如果采取分母布局的化，应该是

\nabla ln p (t | w, β) = \sum n = 1 N ϕ (x n) {t n - w T ϕ (x n)}

但是两者之间求出来的值是否一致还不清楚，需要进一步讨论。

解得

0 = \sum n = 1 N t n ϕ (x n) T - w T \sum n = 1 N ϕ (x n) ϕ (x n) T

对该式求解，得到

w M L = (Φ T Φ) - 1 Φ T t

其中

Φ = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ϕ 0 (x 1) ϕ 0 (x 2) ⋮ ϕ 0 (x N) ϕ 1 (x 1) ϕ 1 (x 2) ⋮ ϕ 1 (x N) \dots \dots ⋱ \dots ϕ M - 1 (x 1) ϕ M - 1 (x 2) ⋮ ϕ M - 1 (x N) ⎞ ⎠ ⎟ ⎟ ⎟ ⎟

这个推导过程还没有自己验证成功过 T^T
当把

ED(w)中的

w0提出来，得到

E D (w) = 1 2 \sum n = 1 N {t n - w T ϕ (x n)} 2 = 1 2 \sum n = 1 N {t n - \sum j = 0 M - 1 w j ϕ j (x n)} 2 = 1 2 \sum n = 1 N {t n - w 0 - \sum j = 1 M - 1 w j ϕ j (x n)} 2

对

w0求导，得到

w 0 = t ⎯ - \sum j = 1 M - 1 w j ϕ j ⎯ ⎯ ⎯ ⎯ t ⎯ = 1 N \sum n = 1 N t n ϕ j ⎯ ⎯ ⎯ ⎯ = 1 N \sum n = 1 N ϕ j (x n)

因此实际上

w0刻画了目标值的均值和基函数的加权和的差值。相似的，易得

β的最大似然估计为

1 β M L = 1 N \sum n = 1 N {t n = w T M L ϕ (x n)} 2

阅读全文

0 0