根据定义,Rn中点x,y之间的欧几里得距离是
d(x,y)=|x−y|=⟨x−y,x−y⟩1/2
函数d(欧几里得度量)是R2n上的凸函数,(这个结论基于的事实是:将欧几里得范数f(z)=|z|和从R2n到Rn的线性变换(x,y)→x−y结合即可)Rn中我们熟悉的闭集(closed set),开集(open set),闭包(closure)和内点(interior)这些拓扑概念通常可以用向量相对于欧几里得度量收敛的形式引入,但是这种收敛等价于Rn 中一向量序列收敛。
下面我们将看到Rn中凸集的拓扑概念比其他集合都要简单。
凸函数是开集和闭集的一个重要来源,Rn上任意连续实值函数f有开水平集{x|f(x)<α}和闭水平集{x|f(x)≤α},并且当f是凸时这些集合也是凸的(定理4.6)。
本文中,我们将用B表示Rn中的欧几里得单位球(Euclidean unit ball):
B={x||x|≤1}={x|d(x,0)≤1}
这是一个凸集(欧几里得范数的一个水平集,欧几里得范数是连续且凸的),对于任意a∈Rn,圆心为a半径为ε>0的球为
{x|d(x,a)≤ε}={a+y||y|≤ε}=a+εB
对于Rn上的任意集C,与C的距离不超过ε 的点x集合是
{x|∃y∈C,d(x,y)≤ε}=∪{y+εB|y∈C}=C+εB
因此C的闭包cl C和内点int C可以表示成
cl Cint C=∩{C+εB|ε>0}={x|∃ε>0,x+εB⊂C}
对于凸集,有一个更加方便的概念:相对内点(relative interior),引入这个概念的原因是嵌入在R3中的线段和三角形没有内点。Rn中凸集C的相对内点我们用ri C表示,当把C看成其仿射包aff C 的子集时,其相对内点和内点的定义一样,因此ri C由x∈aff C 的点组成,并且存在ε>0,使得y∈aff C,d(x,y)≤ε时y∈C。换句话说,
ri C={x∈aff C|∃ε>0,(x+εB)∩(aff C)⊂C}
显然,
ri C⊂C⊂cl C
集合差(cl C)∖(ri C)称为C 的相对边界(relative boundary),自然地,当ri=C 时,我们说C是相对开的(relatively open)。
对于n为凸集,根据定义aff C=Rn,所以ri C=int C。
注意,当C1⊃C2时,这就暗含了cl C1⊃cl C2,int C1⊃int C2,但是一般情况下ri C1⊃ri C2是不成立的。例如,如果C1 是R3中的立方体,C2是C1的某个面,ri C1和ri C2都非空但不相交。
根据定理仿射集是相对开的,同时是闭的。这个结论基于以下事实:仿射集是超平面的交(推论1.4.1)并且每个超平面H可以表示成连续函数的水平集(定理1.3):
H={x=(ξ1,…,ξn)|β1ξ1+⋯+βnξn=β}
另外对于任意C
cl C⊂cl(aff C)=aff C
因此通过cl C中任意两个不同点的直线完全在aff C。
平移和Rn到自身一对一的仿射变换保留闭包和相对内点,事实上,这样的变换保留仿射包并且两个方向都是连续上(因为在仿射变换下向量x像的元素是x 元素ξj的线性或仿射函数)。建议大家记住这个结论,因为它将会帮助我们简化证明过程。例如,如果C是Rn中m为凸集,利用推论1.6.1存在Rn到自身的一对一仿射变换T将aff C搬运到子空间的位置
L={x=(ξ1,…,ξm,ξm=1,…,ξn)|ξm+1=0,…,ξn=0}
这个L可以看成Rm的一份拷贝,利用这种方式我们通常可以将一般的凸集问题简化为凸集是全维的情况,即,整个空间就是它的仿射包。
下面关于凸集闭包和相对内点的性质是基本的。
定理6.1 令C是Rn中的凸集,令x∈ri C,y∈cl C,那么对于0≤λ<1,(1−λ)x+λy 属于ri C(自然属于C)。
证明:利用前面的讨论,我们可以只考虑C是n维的情况,这样的话ri C=int C。令λ∈[0,1),那么我们必须标明对于ε>0,(1−λ)x+λy+εB包含在C中。因为y∈cl C,所以y∈C+εB,那么对于每个ε>0
(1−λ)x+λy+εB⊂(1−λ)x+λ(C+εB)+εB=(1−λ)[x+ε(1+λ)(1−λ)−1B]+λC
根据假设x∈int C,所以当ε充分小时,后面那个集合含于(1−λ)C+λC=C。||
下面两个定理描述了Rn中所有凸集上的运算cl,ri最重要的性质。
定理6.2 令C是Rn上的任意凸集,那么cl C,ri C是Rn上的凸集且和C有相同的仿射包,于是维数也相同。(特别地,如果C≠∅,那么ri C≠∅)
证明:对于任意ε,集合C+εB是凸的,因为它是凸集合的线性组合。对于所有的ε>0,所有这些集合的交是cl C,因此cl C是凸的。cl C的仿射包最起码和C的仿射包一样大,因为cl C⊂aff C,实际上它和aff C是一样大的,ri C的凸性是前面定理(取y属于ri C)的推论。为了完成证明,接下来需要说明当C是n维的时候n>0,C的内点非空,n为凸集包含一个n维单纯形(定理2.4),然后我们需要说明这样的单纯形S有非空内点。我们假设S的顶点是向量(0,0,…,0),(1,0,…,0),…,(0,…,0,1):
S={(ξ1,…,ξn)|ξj≥0,ξ1+⋯+ξn≤1}
(如果需要的话可以进行反射变换),但是这个单纯形有非空内点,即
int S={(ξ1,…,ξn)|ξj>0,ξ1+⋯+ξn<1}
因此int S≠∅。||
对于Rn中的任意集C,不管凸还是非凸,法则
cl(cl C)=cl C,ri(ri C)=ri C
都是成立的,下面的法则在凸的情况下才成立。
定理6.3 对于Rn中的任意凸集C,cl(ri C)=cl C,ri(cl C)=ri C。
证明:因为ri C⊂C,所以cl(ri C)含于cl C,另一方面,给定任意的y∈cl C,x∈ri C(根据上面的定理当C≠∅时这样的x肯定存在),位于x,y 之间的线段除了y 外(定理6.1) 完全位于ri C内,因此y∈cl(riC),这就证明了cl(ri C)=cl C。因为cl C⊃C并且cl C和C的仿射包是一致的,所以ri(cl C)⊃ri C。
接下来令z∈ri(cl C),我们将说明z∈ri C。 令x是ri C中的任一点,(我们假设x≠z,否则的话z∈ri C定理成立)考虑通过x,z的直线,对于μ>1且μ−1充分小,那么在这条直线上的点
y=(1−μ)x+μz=z−(μ−1)(x−z)
属于ri(cl C)因此属于cl C。 对于这样的一个y,我们可以将z表示成(1−λ)x+λy,0<λ<1(特别地λ=μ−1),根据定理6.1,z∈ri C。||
推论6.3.1 令C1,C2是Rn中的凸集,那么当且仅当ri C1=ri C2,cl C1=cl C2,这个条件等价于ri C1⊂C2⊂cl C1。
推论6.3.2 如果C是Rn上的凸集,那么和cl C 有交点的开集也和ri C有交点。
推论6.3.3 如果C1是Rn上非空凸集C2相对边界的凸子集,那么dimC1<dimC2。
证明:如果C1和C2有同样的维数,那么它相对于aff C2将会有内点,但是这种点不可能含于cl(ri C2),因为ri C2和C1是不相交的,因此他们不可能含于cl C2。||
下面介绍的相对内点特征经常被用到,而且非常有用。
定理6.4 令C是Rn中非空凸集,那么当且仅当对于每个x∈C,存在μ>1使得(1−μ)x+μz属于C时,z∈ri C。
证明:定理中的条件意味着C中每条以z为端点的线段可以在z上延长而不离开C,如果z∈ri C那么这明显为真。反过来,假设z满足条件。根据定理6.2,因为ri C≠∅,所以存在一个点x∈ri C,令y是C中对应的点(1−μ)x+μz,μ>1,(根据假设它是存在的),那么z=(1−λ)x+λy,0<λ=μ−1<1,因此根据定理6.1z∈ri C。||
推论6.4.1 令C是Rn中的凸集,那么当且仅当对于每个y∈Rn,存在ε>0使得z+εy∈C时,z∈int C。
接下来我们考虑在凸集上执行同样的运算相对内点将如何变化的问题。
定理6.5 对于i∈I(索引集)令Ci是Rn中的凸集,假设集合ri Ci至少有一个公共点,那么
cl∩{Ci|i∈I}=∩{cl Ci|i∈I}
如果I是有限的,那么
ri∩{Ci|i∈I}=∩{ri Ci|i∈I}
证明:固定x为任意一个含于集合ri Ci交的元素,给定y为任意一个含于集合cl Ci交的元素,根据定理6.1,向量(1−λ)x+λy 属于每个ri Ci,0≤λ<1,并且y是这个向量随着λ↑1时的极限,下式是成立的
∩icl Ci⊂cl∩iri Ci⊂cl∩iCi⊂∩icl Ci
这就建立了本定理的闭包公式,同时它也证明了∩iri Ci,∩iCi有相同的闭包。根据推论6.3.1,最后两个集合肯定有相同的相对内点,因此
ri∩iCi⊂∩iri Ci
假设I是有限的,我们接下来证明反向包含关系,取任意z∈∩iri Ci,根据定理6.4,∩iCi中任意以z为端点的线段可以在每个集合∩iCi中稍微延长,这些延长线段的交含于原来线段∩iCi之中,这是因为他们只是有限多个。因此根据定理6.4的判定准则z∈∩iCi。||
当集合ri Ci没有公共点时,定理6.5中的公式不成立,考虑I=1,2的一个实例,C1是R2中不含原点的正象限而C2是R2的水平轴,第二个公式中还需要I是有限的:对于α>0的实区间[0,1+α]的交集是[0,1],但是对于α>0的实区间ri [0,1+α]的交不是ri [0,1]。
推论6.5.1 令C是凸集,令M是仿射集(像直线和超平面)且包含ri C中的一个点,那么
ri (M∩C)=M∩ri C,cl (M∩C)=M∩cl C
证明:对于仿射集,ri M=M=cl M。||
推论6.5.2 令C1是凸集,令C2是含于cl C1 而又没有完全含于C1相对内点的凸集,那么ri C2⊂ri C1。
证明:推论中的假设暗示ri C2和ri(cl C1)=ri C1有一个公共点,否则的话相对边界cl C1∖ri C1将包含ri C2和它的闭包cl C2,因此
ri C2∩ri C1=ri C2∩ri(cl C1)=ri(C2∩cl C1)=ri C2
即ri C2⊂ri C1。||
定理6.6 令C是Rn中的凸集,令A是从Rn到Rm的线性变换,那么
ri(AC)=A(ri C),cl(AC)⊃A(cl C)
证明:闭包的包含关系仅仅反映了线性变换是连续的这个事实;它不依赖于C是否为凸。为了证明相对内点的结论,我们首先讨论
cl A(ri C)⊃A(cl (ri C))=A(cl C)⊃AC⊃A(ri C)
这就表明AC和A(ri C)有相同的闭包,于是根据推论6.3.1也有相同的相对内点,因此ri(AC)⊂A(ri C)。现在假设z∈A(ri C),我们将用定理6.4来表明z∈ri(AC),令x是AC中的任意一点,选择任意元素z′∈ri C,x′∈C使得Az′=z,Ax′=x,存在某个μ>1使得向量(1−μ)x′+μz′属于C,在A的变换下这个向量的像是(1−μ)x+μz,于是对于某个μ>1,(1−μ)x+μz属于AC,因此z∈ri(AC)。||
定理6.6中cl(AC)和A(cl C)之间可能的差异将会在第9节讨论。
推论6.6.1 对于任意凸集C和任意实数λ,ri(λC)=λri C。
证明:取A:x→λx。||
对于凸集C1⊂Rm,C2⊂Rp在Rm+p中的直和C1⊕C2,我们有
ri(C1⊕C2)cl(C1⊕C2)=ri C1⊕ri C2=cl C1⊕cl C2
当与定理6.6结合时,我们得到下面的事实。
推论6.6.2 对于Rn中的任意凸集C1,C2
ri(C1+C2)cl(C1+C2)=ri C1+ri C2⊃cl C1+cl C2
证明:C1+C2=A(C1⊕C2),其中A从R2n到Rn的加法线性变换,即A:(x1,x2)→x1+x2。||
推论6.6.2将会在推论9.1.1和9.1.2中深入讨论。
定理6.7 令A是从Rn到Rm的线性变换,令C是Rm 中的凸集,使得A−1(ri C)≠∅,那么
ri(A−1C)=A−1(ri C),cl(A−1C)=A−1(cl C)
证明:令D=Rn⊕C,令M是A的图像,那么M是一个仿射集(事实上如第1节说的那样是一个子空间)并且M包含ri D中的一个点。令P是从Rn+m到Rn的投影(x,y)→x,那么A−1C=P(M∩D),根据定理6.6和推论6.5.1,我们有
ri(A−1C)cl(A−1C)=P(ri(M∩D))=P(M∩ri D)=A−1(ri C)⊃P(cl(M∩D))=P(M∩cl D)=A−1(cl C)
而A的连续性暗含了cl(A−1C)⊂A−1(cl C)。||
现在考虑m=n=2时定理6.7的一个反例,此时相对内点不满足条件。C是R2的不包含原点的正象限,而A将(ξ1,ξ2)投影到(ξ1,0)上。
通过上面的结果可知,对于相对开凸集,有限的交,标量乘法,加法和线性(仿射)变换下取像或原像运算后依然是相对开凸集。
定理6.8 令C是Rm+p中的凸集,对于每个y∈Rm,令Cy是向量z∈Rp的集合,使得(y,z)∈C。令D={y|Cy≠∅},那么当且仅当y∈ri D,z∈ri Cy时(y,z)∈ri C。
证明:投影(x,y)→y将C搬到D上,根据定理6.6也将ri C搬到ri D上。给定y∈ri D和仿射集M={(y,z)|z∈Rp},ri C中的点就是
M∩ri C=ri(M∩C)=(y,z)|z∈ri Cy
公式中的第一个等式由推论6.5.1得出,因此任意给定y∈ri D,当且仅当z∈ri Cy时我们有(y,z)∈ri C。||
推论6.8.1 令C是Rn中的非空凸集,令K是{(1,x)|x∈C}生成的Rn+1中的凸锥,那么ri K由(λ,x)组成,其中λ>0,x∈λri C。
证明:令定理中的Rm=R,Rp=Rn。||
利用上面介绍的,我们可以构造一个很简单实例。由非空凸集C生成的Rn中凸锥的相对内点由形如λx的向量组成,其中λ>0,x∈ri C。对于这种锥闭包的形式将会在定理9.8中给出。
仔细观察可以得出,凸锥的相对内点和相对闭包也一直是凸锥,这可以从推论6.6.1中立刻得出,因为对于凸集C,当且仅当对每个λ>0时λC=C,这个凸集是凸锥。
定理6.9 令C1,…,Cm是Rn中的非空凸集,令C0=conv(C1∪⋯∪Cm)。那么
ri C0=∪{λ1ri C1+…+λmri Cm|λi>0,λ1+⋯+λm=1}
证明:令Ki是{(1,xi)|xi∈Ci},i=0,1,…,m 生成的Rn+1中的凸锥,那么
K0=conv(K1∪⋯∪Km)=K1+⋯+Km
(定理3.8),于是利用推论6.6.2
ri K0=ri K1+⋯+ri Km
根据推论6.8.1,ri Ki由(λi,xi)组成,其中λi>0,xi∈λiri Ci,因此x0∈ri C0等价于(1,x0)∈ri K0,转而等价于
x0∈(λ1ri C1+⋯+λmri Cm)
其中λ1>0,…,λm>0,λ1+⋯+λm=1。||
定理6.9中C0的闭包将会在定理9.8中讨论。
附:文章PDF版本http://pan.baidu.com/s/1mhGNjuw