初识斜率优化

来源：互联网发布：linux下apache配置php 编辑：程序博客网时间：2024/05/29 06:39

引子

数与形是数学中两个最古老而又最基本的对象，数形结合又是一种重要的数学思想。

在当今信息学竞赛中，某些纷繁复杂的试题背后，往往蕴含着丰富的几何背景，而计算几何类问题却又需要借助计算机强大的实数运算能力。正如华罗庚先生所说的“数形结合千般好”，在算法和程序设计中，巧妙地运用数形结合思想，可以顺利的破解问题，化难为易，找到问题的解题思路。

数形结合思想常包括以形助数、以数助形两个方面。

以形助数

正如前文所述，一些试题中繁杂的代数关系身后往往隐藏着丰富的几何背景，而借助背景图形的性质，可以使那些原本复杂的数量关系和抽象的概念，显得直观，从而找到设计算法的捷径。

[例一]Raney引理的证明

[题意简述]

设整数序列A = {A_i, i=1, 2, …, N}，且部分和S_k=A₁+…+A_k，序列中所有的数字的和S_N=1。

证明：在A的N个循环表示[1]中，有且仅有一个序列B，满足B的任意部分和S_i均大于零。

[分析]

先来看一个例子，若有序列A = <1, 4, -5, 3, -2, 0>，其6个循环表示为

1. <1,4, -5, 3, -2, 0>

2. <4,-5, 3, -2, 0, 1>

3. <-5,3, -2, 0, 1, 4>

4. <3,-2, 0, 1, 4, -5>

5. <-2,0, 1, 4, -5, 3>

6. <0,1, 4, -5, 3, -2>

其中只有第4个序列，部分和为3, 1, 1, 2, 6, 1，满足成为序列B的条件。

若要用一般的代数或是组合方法来证明这个有趣的结论，似乎无从下手，但若要想到了用“形”来帮忙，问题就简单多了。

目标图形化

周期性的推广A序列，得到一个无穷序列，便于观察其循环表示，得到：

<A₁,A₂, …, A_N, A₁,A₂, …, A_N, …>

同时计算这个序列的部分和S_i，因为这个序列是周期性的，因此对于所有的k>0，均有S_k_+N=S_k+1。如果做出这个函数的图像，则可以说函数有一个“平均斜率”为：每沿横轴正方向走N个单位，函数值就增加1。于是如下图所示，可以用两条斜率为的直线“夹住”函数包含的所有点：

图 1 无穷序列的部分和函数图像

图示中N=6，且使用了上文举的例子。注意较低的那条直线，在每连续的N个单位长度中，它与函数图像有且仅有一个交点，这是因为斜率是的直线在每N个单位长度中最多到达一次整数点。这个交点是在这以后的N个点中的最低值，因此由此处的后一个位置导出的循环表示的所有部分和均为正数。而同时每连续N个单位长度仅有一个交点也证明了解的唯一性。

小结

一个简单的几何论证就证明了著名的Raney引理，其简练是其他方法不能企及的。

Raney引理有很广泛的应用，Catalan数以及扩展Catalan数的组合公式就可以用该引理轻松解决。比如今年上海市选拔赛第二天比赛中的序列(Sequence)以及OIBH练习赛中的项链，使用Raney引理都是最简单的方法之一。

用几何图形辅助思考，不只停留在组合计数这一类中，更渗透在算法设计和优化的每一个分支中，近年来流行的“斜率优化”法是另一个很好的例子。

[例二]最大平均值问题(USACO 2003 March Open)

[题意简述]

读入一列正数，a₁, a₂, …, a_N，以及一个数F。定义，i≤j。

求Max{ave(a,b), 1≤a, b≤N，且a≤b-F+1}，即求一段长度大于等于F且平均值最大的子串。

范围：F≤N≤10⁵。

[分析]

简单的枚举算法可以这样描述：每次枚举一对满足条件的(a,b)，即a≤b-F+1，检查ave(a,b)，并更新当前最大值。

然而这题中N很大，N²的枚举算法显然不能使用，但是能不能优化一下这个效率不高的算法呢？答案是肯定的。

目标图形化

首先一定会设序列a_i的部分和：S_i=a₁+a₂+…+a_i_，，特别的定义S₀=0。

这样可以很简洁的表示出目标函数！

如果将S函数绘在平面直角坐标系内，这就是过点S_j和点S_i_-1直线的斜率！

于是问题转化为：平面上已知N+1个点，P_i(i, S_i)，0≤i≤N，求横向距离大于等于F的任意两点连线的最大斜率。

构造下凸折线

有序化一下，规定对i<j，只检查P_j向P_i的连线，对P_i不检查与P_j的连线。也就是说对任意一点，仅检查该点与在其前方的点的斜率。于是我们定义点P_i的检查集合为

G_i = {P_j, 0≤j≤i-F}

特别的，当i<F时，G_i为空集。

其明确的物理意义为：在平方级算法中，若要检查ave(a,b)，那么一定有P_a∈G_b；因此平方级的算法也可以这样描述，首先依次枚举P_b点，再枚举P_a∈G_b，同时检查k(P_aP_b)。

若将P_i和G_i同时列出，则不妨称P_i为检查点，G_i中的元素都是P_i的被检查点。

当我们考察一个点P_t时，朴素的平方级算法依次选取G_t中的每一个被检查点p，考察直线pP_t的斜率。但仔细观察，若集合内存在三个点P_i,P_j, P_k，且i<j<k，三个点形成如下图所示的的关系，即P_j点在直线P_iP_k的上凸部分：k(P_i,P_j)>k(P_j, P_k)，就很容易可以证明P_j点是多余的。

图 2

若k(P_t,P_j) > k(P_t, P_i)，那么可以看出，P_t点一定要在直线P_iP_j的上方，即阴影所示的1号区域。同理若k(P_t,P_j) > k(P_t, P_k)，那么P_t点一定要在直线P_jP_k的下方，即阴影所示的2号区域。

综合上述两种情况，若P_tP_j的斜率同时大于P_tP_i和P_tP_k的，P_t点一定要落在两阴影的重叠部分，但这部分显然不满足开始时t>j的假设。于是，P_t落在任何一个合法的位置时，P_tP_j的斜率要么小于P_tP_i，要么小于P_tP_k，即不可能成为最大值，因此P_j点多余，完全可以从检查集合中删去。

这个结论告诉我们，任何一个点P_t的检查集合中，不可能存在一个对最优结果有贡献的上凸点，因此我们可以删去每一个上凸点，剩下的则是一个下凸折线。最后需要在这个下凸折线上找一点与P_t点构成的直线斜率最大——显然这条直线是在与折线相切时斜率最大，如图所示。

图 3

维护下凸折线

这一小节中，我们的目标是：用尽可能少的时间得到每一个检查点的下凸折线。

算法首先从P_F开始执行：它是检查集合非空的最左边的一个点，集合内仅有一个元素P₀，而这显然满足下凸折线的要求，接着向右不停的检查新的点：P_F₊₁,P_F₊₂, …, P_N。

检查的过程中，维护这个下凸折线：每检查一个新的点P_t，就可以向折线最右端加入一个新的点P_t_-F，同时新点的加入可能会导致折线右端的一些点变成上凸点，我们用一个类似于构造凸包的过程依次删去这些上凸点，从而保证折线的下凸性。由于每个点仅被加入和删除一次，所以每次维护下凸折线的平摊复杂度为O(1)，即我们用O(N)的时间得到了每个检查集合的下凸折线。

最后的优化：利用图形的单调性

最后一个问题就是如何求过P_t点，且与折线相切的直线了。一种直接的方法就是二分，每次查找的复杂度是O(log₂N)。但是从图形的性质上很容易得到另一种更简便更迅速的方法：由于折线上过每一个点切线的斜率都是一定的[3]，而且根据下凸函数斜率的单调性，如果在检查点P_t时找到了折线上的已知一个切点A，那么A以前的所有点都可以删除了：过这些点的切线斜率一定小于已知最优解，不会做出更大的贡献了。

于是另外保留一个指针不回溯的向后移动以寻找切线斜率即可，平摊复杂度为为O(1)。

至此，此题算法时空复杂度均为O(N)，得到了圆满的解决。

小结

回顾本题的解题过程，一开始就确立了以平面几何为思考工具的正确路线，很快就发现了检查集合中对最优解有贡献的点构成一个下凸函数这个重要结论，之后借助计算几何中求凸包的方法维护一个下凸折线，最后还利用下凸函数斜率的单调性发现了找切线简单方法。题解围绕平面几何这个中心，以斜率为主线，整个解题过程一气呵成，又避免了令人头晕的代数式变换，堪称以形助数的经典例题。

顺便提一下：这种方法在加速决策过程，很多动态规划算法都可以运用本题“斜率优化”的方法提高算法效率。如IOI 2002的batch和BOI 2003的euro等。至于这类题目的共同特点，还是很值得研究的，但不在本文讨论范围内，因而不再讨论，但欢迎有兴趣的同学以后和我交流。

[1] 先设一个序列是环状的，则从其任意一个字符处断开以后形成的非环序列即为该序列的一个循环表示。

[2] 用Raney引理解答Sequence的过程，详见附录。

[3] 由于折线没有连续性，因此更准确的应该说，过每一个点切线斜率的范围都一定的。