漫步凸分析十一——分离定理

来源：互联网发布：mac开机按option选恢复编辑：程序博客网时间：2024/05/17 03:05

令C1,C2是Rn中的非空集合，有一个超平面H，如果C1含于其中的一个闭半空间而C2含于相对立的闭半空间，那么我们称H分离(separate)C1,C2；如果C1,C2 都不含于H，那么我们成H真(properly)分离C1,C2；如果存在ε>0使得C1+εB含于一个开半空间而C2+εB含于相对立的开半空间，其中B是单位欧几里得球{x||x|≤1}，那么我们称H强(strongly)分离C1,C2。(当然，Ci+εB是由这样的点x组成的，至少有点y∈Ci使得|x−y|≤ε)

有时候也会考虑其他类别的分离，例如严格(strict)分离，此时C1,C2属于对立的开半空间。然而因为真分离与强分离非常自然地对应于线性代数中的极值，所以目前为止这两种是最有用的。

定理11.1 令C1,C2是Rn中的非空集，当且仅当存在向量b使得

inf{⟨x,b⟩|x∈C1}≥sup{⟨x,b⟩|x∈C2}
sup{⟨x,b⟩|x∈C1}>inf{⟨x,b⟩|x∈C2}

那么存在一个超平面，它真分离C1,C2。
当且仅当存在一个向量b使得
3. inf{⟨x,b⟩|x∈C1}>sup{⟨x,b⟩|x∈C2}

那么存在一个超平面，它强分离C1,C2。

证明：假设b满足条件(a),(b)并选择C1上极小值与C2上极大值之间任意值β。那么我们有b≠0,β∈R，H={x|⟨x,b⟩=β}是一个超平面(定理1.3)。半空间{x|⟨x,b⟩≥β}包含C1，而{x|⟨x,b⟩≤β}包含C2，条件(b)表明C1,C2并非都含于H，所以H真分离C1,C2。

反过来，当C1,C2能被真分离时，分离超平面与包含C1,C2的闭半空间可以只用b,β来描述，即对于每个x∈C1,⟨x,b⟩≥β，对于每个x∈C2,⟨x,b⟩≤β，且至少有一个x∈C1或x∈C2使得严格不等式成立，所以b满足条件(a),(b)。

如果b满足条件(c)，我们可以选择β∈R,δ>0使得对于每个x∈C1,⟨x,b⟩≥β+δ并且对每个x∈C2,⟨x,b⟩≤β−δ。因为单位球B是有界的，所以ε可以选择足够小使得对于每个εB中的y满足|⟨y,b⟩|<δ，那么

C 1 + ε B \subset {x | ⟨ x, b ⟩ > β} C 2 + ε B \subset {x | ⟨ x, b ⟩ < β}

这样的话H={x|⟨x,b⟩=β}强分离C1,C2。反过来，如果C1,C2被强分离，那么对于某个b,β,ε>0，刚刚描述的包含关系是成立的，那么

β \leq inf {⟨ x, b ⟩ + ε ⟨ y, b ⟩ | x \in C 1, y \in B} < inf {⟨ x, b ⟩ | x \in C 1} β \geq sup {⟨ x, b ⟩ + ε ⟨ y, b ⟩ | x \in C 2, y \in B} > sup {⟨ x, b ⟩ | x \in C 2}

所以条件(c)成立。||

两个集合可否被分离是一个存在问题，所以这就是为何分离理论中许多出名的应用都出现在各种存在定理的证明中。最典型的情况就是需要求出满足某种性质的向量b，此时我们可以构造一对凸集C1,C2使得问题中的向量b对应于分离C1,C2的超平面。

Rn中分离超平面的存在性是一个相对基本的问题，不牵涉到选择公理，我们在下面定理的证明中给出了基本构造方法。

定理11.2 令C是Rn中非空相对开凸集，令M是Rn中非空仿射集且不与C相交，那么存在一个包含M的超平面，使得一个开半空间包含C。

证明：如果M本身是超平面，那么有一个开半空间肯定包含C，否则的话C将与C相交，这就与假设矛盾。(如果C包含两个对立开半空间的点x,y，那么这两点之间线段上的点将位于半空间的边界上)假设M不是超平面，那么我们将说明如果构造一个比M维数高且与C不相交的仿射集M′，这个构造法在n步或不到n步后给出一个满足要求的超平面H，这样的话就证明了该定理。

我们假设0∈M(如果需要的话可以进行平移)，这样的话M 是一个子空间，凸集C−M包含C但不含0。因为M不是超平面，所以子空间M⊥包含一个二维子空间P，令M′=P∩(C−M)，这是P中的一个相对开凸集(推论6.5.1与推论6.6.2)，并且它不包含0。接下来我们要做的就是在P中找到一条通过0的直线L且与C′不相交，这样的话M′=M+L将是维数高于M且与C不相交的子空间。(实际上，(M+L)∩C≠∅意味着L∩(C−M)≠∅，这与L∩C′=∅ 是矛盾的)为简单起见，我们将平面P看成R2，如果C′是空集或零维，那么直线L显然存在，如果aff C′是不包含0的直线，我们将L取为过0 的平行线，如果aff C′是包含0的直线，那么我们将L取为过0的垂线。对于剩余的情况，C′是二维的且是开的。集合K=∪{λC′|λ>0}是包含C′的最小凸锥(推论2.6.3)，因为它是开集的并所以它也是开集，而且还不包含0，因此K是R2中角度不超过π的开扇形，我们将L取成延伸扇形一条边界得到的线。||

主要的分离定理如下。

定理11.3 令C1,C2是Rn中的非空凸集，要想存在一个真分离C1,C2的超平面，充分必要条件是ri C1,ri C2没有公共点。

证明：考虑凸集C=C1−C2，根据推论6.6.2，它的相对内部是ri C1−ri C2，所以当且仅当ri C1,ri C2没有公共点时，0∉ri C。接下来，如果0∉ri C，那么根据前面的定理存在一个包含M={0}的超平面使得ri C包含在一个开半空间中；那么半空间的闭包包含C，因为C⊂cl(ri C)，所以如果0∉ri C那么存在向量b使得

0 \leq inf x \in C ⟨ x, b ⟩ = inf x 1 \in C 1 ⟨ x 1, b ⟩ - sup x 2 \in C 2 ⟨ x 2, b ⟩ 0 < sup x \in C ⟨ x, b ⟩ = sup x 1 \in C 1 ⟨ x 1, b ⟩ - inf x 2 \in C 2 ⟨ x 2, b ⟩

根据定理11.1这就意味着C1,C2可以真分离。反过来这些条件意味着0∉ri C，因为这说明包含C半空间D={x|⟨x,b⟩≥0}的存在性，它的内部ri D={x|⟨x,b⟩>0}与C相交，在这种情况中ri C⊂ri D(推论6.5.2)。||

对于真分离，集合最多有一个可以包含在分离超平面中，如R2中的集合

C 1 = {(ξ 1, ξ 2) | ξ 1 > 0, ξ 2 \geq ξ - 1 1} C 1 = {(ξ 1, 0) | ξ 1 \geq 0}

这些集合是不相交的，唯一的分离超平面是ξ1轴，它包含C2，这个例子还说明不相交的闭集不一定能被强分离。

定理11.4令C1,C2是Rn中的非空凸集，要想存在强分离C1,C2的超平面，充分必要条件是

inf {| x 1 - x 2 | | x 1 \in C 1, x 2 \in C 2} > 0

换句话说0∉cl(C1−C2)。

证明：如果C1,C2可以被强分离，那么对于某个ε>0,C1+εB与C2+εB不相交。另一方面，如果后者成立，那么根据前面的定理C1+εB与C2+εB可以被强分离。因为对于ε′=ε/2,εB=ε′B+ε′B，所以集合(C1+ε′B)+ε′B与(C2+ε′B)+ε′B属于对立的闭半空间，这样的话C1+ε′B与C2+ε′B在对立的闭半空间，因此当且仅当对ε>0，原点不属于集合

(C 1 + ε B) - (C 2 + ε B) = C 1 - C 2 - 2 ε B

时，C1,C2可以被强分离。这个条件意味着对于某个ε。0

2 ε B \cap (C 1 - C 2) = \emptyset

换句话说0∉cl(C1−C2)。||

推论11.4.1 令C1,C2是Rn中非空不相交闭凸集且没有公共的回收方向，那么存在一个超平面强分离C1,C2。

证明：因为C1,C2不相交，所以我们有0∉(C1−C2)，但是根据推论9.1.2，在回收条件下cl(C1−C2)=C1−C2。||

推论11.4.2 令C1,C2是Rn中的非空凸集，其闭包是不相交，如果有一个集合是有界的，那么出在超平面强分离C1,C2。

证明：将第一个推论应用到cl C1,cl C2上，其中有一个没有回收方向。||

凸多面体的分离结果会将在推论19.3.3，定理20.2，推论20.3.1与定理22.6中给出。

弱线性不等式组⟨x,bi⟩≤βi,∈I 的解集x是闭凸集，因为它是闭半空间的交集。现在我们将说明Rn中每个闭凸集可以表示成这样的解集。

定理11.5 闭凸集C是包含它的半空间之交。

证明：我们可以假设∅≠C≠Rn，因为否则的话定理明显成立。给定任意a∉C，集合C1={a},C2=C满足定理11.4中的条件，因此存在一个强分离{a},C的超平面，包含C的闭半空间不包含a，所以包含C闭半空间的交除了C中的点外不包含其他点。||

推论11.5.1 令S是Rn的任意子集，那么cl(conv S)是包含S的闭半空间值交。

证明：闭半空间包含C=cl(conv S)当且仅当它包含S。

推论11.5.2 令C是Rn的凸子集但不是Rn 本身，那么存在一个包含C的闭半空间。换句话说，存在b∈Rn使得线性函数⟨⋅,b⟩在C上有上界。

证明：假设表明cl≠Rn(否则的话Rn=ri(cl C)⊂C)。根据定理，一个点属于cl C当且仅当它属于包含cl C 的每个闭半空间，所以包含cl C的闭半空间不会为空。||

定理11.5的深入版本会在定理18.8中给出。

切的几何概念是分析中最重要的工具之一，曲线的切线与曲面的切平面一般用微分的形式定义。在凸分析中，我们利用相反的方法，广义切在几何上用分离来定义，之后这个概念发展成广义微分理论。

广义切表示为支撑超平面与半空间，令C是Rn中的凸集，C的支撑半空间是包含C的闭半空间，且有一个点在C的边界上。C的支撑超平面就是C支撑半空间的边界，它本身是一个超平面。换句话说，C的支撑超平面可以表示成H={x|⟨x,b⟩=β},b≠0其中对于每个x∈C,⟨x,b⟩≤β且至少有一个点x∈C使得⟨x,b⟩=β，因此C的支撑超平面与一个线性函数有关，该函数找到C上的最大值。经过给定点a∈C的支撑超平面对应于向量b，它是C在a处的法向量。

如果C不是n维的，这样的话aff C≠Rn，所以我们总是可以将aff C扩展成包含C的超平面，这样的支撑超平面我们几乎不感兴趣，所以我们只讨论非平凡(non-trivial)的支撑超平面即不包含C本身。

定理11.6 令C是一个凸集，D是C的一个非空凸子集(例如，由单点组成的子集)。要想存在一个C的非平凡支撑超平面且包含D，充分必要条件是D与ri C不相交。

证明：因为D⊂C，所以C的非平凡支撑超平面(包含D)与真分离D,C的超平面是一样的。根据定理11.3，这样的超平面存在，当且仅当ri D与ri C不相交，这个条件等价于D与ri C不相交(推论6.5.2)。||

推论11.6.1凸集在其所有边界点上有非零法向量。

推论11.6.2令C是凸集，x∈C是C的相对边界点，当且仅当存在一个线性函数h使得h实现的作用是：C上x点达到最大值，并且h不是C上的常函数。

前面的结果在凸锥的情况下可以重新定义。

定理11.7 令C1,C2是Rn中的非空子集，至少有一个是锥。如果存在一个超平面真分离C1,C2，那么存在一个超平面真分离C1,C2且过原点。

证明：假设C2是锥。如果C1,C2可以被真分离，那么存在一个向量b，其满足定理11.1的前两个条件。令

β = sup {⟨ x, b ⟩ | x \in C 2}

那么，正如定理11.1中的证明，集合

H = {x | ⟨ x, b ⟩ = β}

是真分离C1,C2的超平面。因为C2是锥，所以

λ ⟨ x, b ⟩ = ⟨ λ x, b ⟩ \leq β < \infty, \forall x \in C 2, \forall λ > 0

这表明β≥0且对每个C2中的x,⟨x,b⟩≤0，因此β=0,0∈H。||

推论11.7.1 Rn中的非空闭凸锥是包含它的齐次闭半空间的交(齐次半空间其边界上有原点)。

证明：利用定理来提炼定义11.5的证明。||

推论11.7.2 令S是Rn中的任意子集，K是由S生成的凸锥的闭包，那么K是所有包含S的齐次闭半空间的交。

证明：齐次闭半空间是包含原点的闭凸锥，这样的锥要想包含S，当且仅当它包含K，然后利用前面的推论即可。||

推论11.7.3 令K中Rn中的凸锥但不是Rn 本身，那么K含于Rn的某个齐次闭半空间。换句话说，存在某个向量b≠0使得对于每个x∈K,⟨x,b⟩≤0。

证明：类似推论11.5.2。||

to be continue.…..

0 0