漫步最优化四十四——基本拟牛顿法

来源：互联网发布：java 多线程源码编辑：程序博客网时间：2024/05/20 20:45

你走进了我的视觉，

我开始发现，

心里有个角落，

一直在等你出现。

你的可爱让我沦陷，

你的魅力让我倾倒，

总是想着看你一遍，

不管天涯海角，

我要在你的身边。

——畅宝宝的傻逼哥哥

对于前面介绍的方法，第

k次迭代生成的点由

x k + 1 = x k - α k S k g k (1)

生成，其中

S k = {I n H - 1 k 对 于 最 速 下 降 法 对 于 牛 顿 法

如果二次问题为

minimize f (x) = a + b T x + 1 2 x T H x

我们现在用任意一个n×n的正定矩阵Sk来求上述问题的解，看看会得到什么。通过对f(xk−αSkgk)求导并令其等于零，最小化f(xk−αSkgk)的α可以化简为

α k = g T k S k g k g T k S k H S k g k (2)

其中

g k = b + H x k

是f(x)在点x=xk处的梯度。

可以说明的是

f (x k + 1) - f (x *) \leq (1 - r 1 + r) 2 [f (x k) - f (x *)]

其中r是SkH最小特征值与最大特征值之比。从效果上看基于等式1与2的算法将线性收敛，其收敛比率为

β = (1 - r 1 + r) 2

如果r=1收敛最快，即SkH的特征值基本相等，这就意味着要想得到最好的结果，我们需要选择

S k H = I n

或者

S k = H - 1

同样地，对于一般的最优化问题，我们选择的正定矩阵Sk应该等于或者至少近似等于H−1k。

拟牛顿法的搜索方向基于正定矩阵Sk，它由可得到的数据生成，并设法作为H−1k的近似。对于H−1k的近似法有许多，因此存在许多不同的拟牛顿法。

阅读全文

0 0