凸限制下的凸优化问题(一)

来源:互联网 发布:网络共享 慢 编辑:程序博客网 时间:2024/05/22 14:37

本文主要介绍在凸限制下的凸优化问题。我们将这个问题记为Problem(P),描述如下:

minf0(x)fi(x)0,iIgi(x)0,iJgi(x)=0,iK

其中f0:RnR{+}是一个凸函数,I,J,K是有限集,当然也可能是空集。fi是凸的,非仿射函数,gi是一个仿射函数。

1.

在解决这个问题之前我们需要次梯度,次微商的概念。令fRn上的凸函数,如果向量x^*满足

f(z)f(x)+x(zx),zRn
那么xf次梯度,所有在x处的次梯度称为fx次微商,记为f(x)
我们需要解释一下次梯度的概念。如果一个函数在某个点处是可微的,那么它在这个点处存在唯一的切平面(原因是梯度的唯一),使得函数图像都是在这个切平面之上的,这里的在切平面之上的意思就是
f(z)f(x)+x(zx),zRn
,其中左面就是经过这个点的切平面。针对凸函数,有些点是不可微的,但是我们仍然可以通过这个点做一个平面,使得这个函数的图像在这个平面之上。这样的平面是不唯一的。我们把所有的符合这样性质的平面的法向量收集起来,就是次梯度。
2.KKT

我们称x¯,(λi)iI,(μi)iJK满足Problem(p)KKT,如果它们满足如下四个条件:

(1)iI,λi0,fi(x¯)0,λifi(x¯)=0(2)iJ,μ0,gi(x¯)0,μigi(x¯)=0(3)iK,gi(x¯)=0(4)0f0(x¯)+iIλfi(x¯)+iJKμi{gi(x¯)}+δC(x¯)

KKT条件的前三个是比较容易理解的,关键是第四个f0,fi不一定是可微的,所以我们用次微商,但是由于gi是仿射函数,所以是可微的,用它的梯度表示。最后一项的作用保证x¯Problem(P)的定义域C内,δC(x)=0如果xC,否则为无穷大。
如果x¯,(λi)iI,(μi)iJK满足KKT条件,那么x¯Problem(P)的解。

3.Problem(P)

根据KKT条件的最后一句话,我们只需找到满足KKT
条件的x¯,(λi)iI,(μi)iJK便可。接下来我们就用拉格朗日函数来解决这个问题。
(Problem(P)的拉格朗日函数)L:Rp+×Rq+×R(rq)×RnR{+},它的自变量为(λ,μ,x)=((λi)iI,(μi)iJ,(μi)iK,x).

L(λ,μ,x)=f0(x)+iI(λifi)(x)+iJμgi(x)+iKμgi(x)
我们称(λ¯,μ¯,x¯)为L的鞍点,如果(λ,μ)Rp+×Rq+×R(rq),xRn

L(λ,μ,x¯)L(λ¯,μ¯,x¯)L(λ¯,μ¯,x)

那么我们给出拉格朗日函数和Problem(P)之间的关系。如果(λ¯,μ¯,x¯)为L的鞍点,那么x¯Problem(P)的解,(λ¯,μ¯)是KKT参数。


我们通常遇到的凸优化问题并非像Problem(P)那样,它的一个变形如下,我们称为Pα,β问题.

minf(x)fi(x)αi,iIgi(x)=βi,iKxRn

其中f和f_i为凸函数,gi为线性函数,fi也可以是线性函数。

1.

V(α,β)=inf{f(x)|xRn,fi(x)αi,iI;gi(x)=βi,iJ}

其中α=(αi)iIRp,β=(βi)iKRr

2.

求解方法仍然是拉格朗日乘子法。令x¯满足fi(x¯)αi,iI,gi(x¯)=βi ,iK,我们称Pα,βx¯(λ,μ)Rp×Rr满足λ0,λi(fi(x¯)αi) =0,iI

ψ(x)=f(x)+iIλi(f(x)αi)+iKμi(gi(x)βi)+δC(x)
x¯处达到最小值。

总结为:如果x¯满足fi(x¯)αi,gi(x¯)=βi,如果Pα,βx¯有一个拉格朗日乘子,那么x¯Pα,β的解.
同时,我们要明白如果x¯Pα,βx¯V(α,β)

0 0