算法中的一个模式:栈式遍历

来源:互联网 发布:云计算行业前景 编辑:程序博客网 时间:2024/05/19 23:28

说到算法,我们都知道,它是一个能够有效解决问题的指令序列。
说到模式,我们都会想到design pattern,它是在软件设计中不断出现的可重用的解决方案。

那么,算法中有没有模式呢?答案是yes。
为了和design pattern区分,我把算法中的模式定义为,在各种算法中不断出现的类似的解决问题方式。

这里我想讲一个在很多算法中都出现过的过程,我把它命名为“栈式遍历”。
我们先定义一下这个过程:
首先,有一个数组a[i] (0<=i<n)。
其次,我们有一个栈,指针top指向栈顶元素。
再次,我们有一个布尔型的判别函数f(top-k+1,top-k+2,..., top, i),表示栈顶的k个元素和a[i]是否相容。
遍历过程是这样的:


1:  for i=0 to n-1
2:    while(栈里面至少有k个元素 and
3:          f(top-k+1,top-k+2,..., top, i) = false)
4:      令栈顶元素退栈
5:    end while
6:    令a[i]进栈
7:  end for

这个过程很简单,通俗的讲就是,如果遍历过程中的a[i]和栈顶的若干数不相容,就一直退栈,直到它们相容了或者栈顶元素不够了。然后把a[i]放进栈里。在这个过程中,每个数进栈一次,至多出栈一次,所以时间复杂度是O(n)。

下面,我们就看看它是如何在具体问题中发挥作用的。
第一个例子是一个很常见的面试问题:
给定一个n*n的数组a[i,j],数组的每个元素不是0就是1。我们要求的是,由1组成的最大矩形面积。比如下面的数组:
                        0000
                        1110
                        0110
                        0111
最大矩形面积是6。
对于这个问题,这里只讨论如何在O(n^2)的时间复杂度下求出该面积。为了解决问题,我们先解决一个稍微容易一些的子问题,有了这个子问题的结论,原问题就不费吹灰之力了。
考虑下列问题:
假设平地有n个高高低低的木棍排成一排,其高度用a[0..n-1]表示,其宽度为1。我是否能在O(n)的时间内,求出这些木棍所覆盖的最大矩形面积?比如我有高度为1,3,2,4,1的5根木棍,如下图所示
                               |
                             | |
                             |||
                            |||||
其覆盖的最大矩形区域由下图中的*号表示,面积为6。
                                |
                             |  |
                            ***
                           |***|

如果能够在O(n)的时间解决这个子问题,原问题一定可以在O(n^2)的时间内解决。这是因为,如果把a[i,j]数组的每一行切开向上看去,连续的1就是子问题中的木棍!

下面我们看看栈式遍历是如何来解决这个子问题的。
经观察我们发现,对于每一根木棍,总是有一个由它的高度所决定的最大矩形,这个矩形有一个左边界,一个右边界,在这两个边界里面,所有的其它木棍都不会比这根木棍矮(上例中由*号覆盖的区域就是由高度为2的木棍决定的)。而问题的解就是每个木棍所决定的最大矩形中的最大者。为了寻找由某个木棍高度决定的最大矩形,我们必须找到这两个边界。显然,如果朴素地对每个木棍分别向两边循环查找,时间复杂度一定高O(n)。那么有什么不朴素的方法呢?这个时候,栈式遍历闪亮出场了!

我们定义判别函数为f(top, i) = true   if a[i]>=栈顶元素
                                       = false  if a[i]<栈顶元素
(这里只需要跟栈顶元素比较,所以k为1)
然后我们按照上面所讲的栈式遍历,对数组a[i]从左到右进行遍历。如果我们把0..n-1看做时间的话,那么对于每个a[i],我们发现,它出栈的那个时刻,即是它所决定的那个最大矩形的右边界!!对于最后没有出栈的木棍,我们把n作为右边界。也就是说,在一次栈式遍历的过程中,我们可以同时找到所有木棍所决定的最大矩形的右边界。同理,我们再从右往左遍历一次,就可以找到它们的左边界。因此,在O(n)的时间内,我们把问题解决了。再回到原问题,我们利用栈式遍历得到了一个O(n^2)的算法。

第二个例子,我想讲讲计算几何中求凸壳的graham scan算法。这个经典算法,就是用栈式遍历得到的。
对于平面中的一堆点,我们要求它的凸壳。graham scan算法可以描述为:
1:  将所有点p(x,y)按照y从小到大排序,如果y相同则比较x
2:  将p0和p1入栈
3:  for i=2 to n-1
4:    while(栈中至少有2个元素 and
5:             S(p_top-1, p_top, pi)<=0) (S函数用来计算3个点所组成的有向面积)
6:      将栈顶元素退栈
7:    end while
8:    将pi入栈
9:  end for
我们看到了,这个就是栈式遍历!这里的k为2,即对每个点pi要根据栈顶的2个点才能判别是否相容。
事实上,上述算法只找到了凸包中右半边的点。我们令i从大到小再做一遍,即可得到凸包左半边的点。
对于graham scan算法的更多的信息,可以参考wiki:http://en.wikipedia.org/wiki/Graham_scan。

最后总结一下,这篇文章里讲述了一个利用栈对数据进行处理的方式。这个方式很简单,但是通过对判别函数的定义,我们可以用它发掘出数据中潜在的相互关系,并通过一些遍历过程中的附加信息(比如进栈和出栈的时间)解决问题。我们可以把这个算法的模式看做一种解决问题的思路,当面对新问题的时候,尝试一下也许能有意想不到的效果。

原创粉丝点击