漫步数学分析三十七——极大值与极小值

来源:互联网 发布:网络舆情网 编辑:程序博客网 时间:2024/06/07 00:02

定理10有一个非常重要的应用,它给我们提供了确定函数极大值与极小值的方法。我们期望从单变量函数的相关知识来得出二阶导数的判定准则,所以我们先回顾一下实变量实况。

如果f:RRx0处有一个局部极大或极小,并且fx0处可微,那么f(x0)=0。更进一步,如果f 二次连续可微,并且若f′′(x0)<0,那么x0是局部最大值,若f′′(x0)>0,那么它是局部最小值。

为了将这些事实推广到函数f:ARnR上,我们首先从相关定义开始。

6f:ARnR,其中A是开集。如果存在一个x0A的邻域并且在这个邻域内f(x0)是最大值,即对于邻域内的所有x,f(x0)f(x),我们称f(x0)f的局部最大值。同样的,我们可以定义f的局部最小值。如果一个点要么是f的局部最大值要么是最小值,那么我们称该点是极值点(extreme),如果f 在点x0处可微且Df(x0)=0,那么我们称x0是驻(critical)点。

第一个基本事实可以用下面的定理来表述。

11如果f:ARnR是可微的,A是开集,如果x0Af的一个极值点,那么Df(x0)=0;即x0是一个驻点。

它的证明大部分与基本微积分是一样的,因为f图像的极值点肯定有一个水平切平面,所以这个结论直观上非常明显。然而,仅仅是驻点不能保证该点就是极值点。例如考虑函数f(x)=x3,因为Df(0)=0,所以0是该函数的驻点,但是x>0x3>0,而x<0x3<0,所以0不是极值。另一个例子是f(x,y)=y2x20=(0,0)是驻点,因为f/x=2x,f/y=2y,所以Df(0,0)=0。然而在0的任何邻域内我们可以找出使得f大于零与小于0的点。不是局部极值的驻点称为鞍点(saddle point),图1说明了为了用这个术语。

对于f:ARR,我们已经说明如果f(x)=0,f′′<0,那么它有局部最大值,回忆一下几何情况,f′′<0意味着f是向下凹的。为了推广,下面我们引进函数g在点x0处海森(Hessian)的概念。

7 如果g:BRnRC2类,那么gx0处的海森定义为双线性函数Hx0(g):Rn×RnR,形式为Hx0(g)(x,y)=D2g(x0)(x,y)(注意负号),从而海森仅仅是二阶偏微分的矩阵加负号。

双线性形式,即双线性映射B:Rn×RnR称为正定的(positive definite),如果对于Rn中所有的x0,B(x,x)>0。称为半正定的(positive semidefinite),如果对于Rn中所有的x0,B(x,x)0。负定与半负定双线性形式定义类似。


这里写图片描述
图1

接下来我们推广到多变量的情况。

12

  1. 如果f:ARnR是定义在开集A上的C2函数,并且x0f的驻点使得Hx0(f)是正定的,那么fx0处有一个局部最大值。
  2. 如果fx0处有一个局部最大值,那么Hx0(f)是半正定的。

对于极小值的情况只需要将上面定理中的正改成负即可,注意f的最小值就是f的最大值。

Hx0(f)对标准基的矩阵是

2fx1x12fxnx12fx1xn2fxnxn

其中偏导数都是在x0处计算的。

n=1时,定理12(i)简化为单变量测试f′′(x0)<0。如果f′′(x0)=0,那么函数有极大值或极小值或鞍点,(此时测试失效)例如f(x)=x4,x5,x4x0=0处分别有最大值,鞍点与极小值,虽然他们的f′′(x0)=0

提及一些线性代数的知识可能比较有帮助,令Δk是矩阵

2fx1x12fxkx12fx1xk2fxkxk

的行列式,这个矩阵就是海森矩阵去掉最后nk行和列得到的,那么对称矩阵Hx0(f)是正定的,当且仅当对所有的k=1,,n,Δk>0,它是半正定的当且仅当对所有k=1,,n,Δk0。这里我们不证明一般情况,在下面的例1中,我们证明2×2矩阵,下面还给出了负定的判别准则,从而对k=1,,n,如果Δk>0,那么f在驻点x0处有(局部)最大值,这可能是应用定理12 的最佳方式。对任意k如果Δk<0,那么fx0 处没有最大值。同样的,如果Hx0(f)是负定的,那么fx0处有(局部)最小值。通过改变Hx0(f)的符号以及利用行列式的性质,可以得出如果k为奇数时Δk<0k为偶数时Δk>0,那么Hx0(f)是负定的,如果k为奇数时Δk0k为偶数时Δk0,那么Hx0(f)是负定的,从而当k为奇数时Δk<0,当k为偶数时Δ>0,那么fx0处有最小值。

如果对某些奇数k,Δk>0,对某些偶数k,Δ<0,那么fx0处不可能有最小值。事实上,如果对面某些k,Δk<0fx0既没有最大值也没有最小值,x0肯定是f的鞍点。

这个定理在力学中也非常有用,这时f是一个系统的势能,那么最小值对应稳定态,最大值与鞍点对应不稳定态。

1说明矩阵

[abbd]

是正定的,当且仅当a>0,adb2>0

正定意味着

(x,y)(0,0)[xy][abbd][xy]>0

ax2+2bxy+dy2>0。首先假设对于所有的(x,y)(0,0)该不等式均成立,令y=0,x=1我们得到a>0,令y=1,那么对所有的x,我们有ax2+2bx+d>0,这个函数是抛物线且在2ax+2b=0处有最小值(因为a>0),即x=b/a,从而

a(ba)2+2b(ba)+d>0

adb2>0。反过来可以用同样的方式来证明。

2研究f(x,y)=x2xy+y2鞍点(0,0)的性质。

这里

fx=2xy, 2fx2=2, 2fxy=1, fy=x+2y, 2fy2=2

所以海森矩阵是

[2112]

这里Δ1=2<0,Δ2=41=3>0,所以海森矩阵是负定的,从而我们有一个局部最小值。

0 0
原创粉丝点击