顺序统计学

来源：互联网发布：怎么成为淘宝服务商编辑：程序博客网时间：2024/04/28 02:55

http://blog.csdn.net/xiazdong/article/details/8546127

先来看一个问题：“给定一个无序的序列，求序列的中位数。”

正常的答案都是“先排序，再取A[n/2]，花费O(nlgn)”，学习完本文后，发现其实能够在O(n)求出中位数。

但是要注意，有些场景下前一种方法更好，比如说：“要分别求第1个顺序统计量、第二个顺序统计量、第三个顺序统计量、....、第n个顺序统计量”，如果使用“先排序后取”的方法只要 O (nlgn)，但是后一种方法，则要O(n^2)（n次select方法）。

顺序统计学要解决的问题是：“给定一个无序序列，问第k个小的数是什么？”

顺序统计学的算法是基于快速排序的partition函数，并运用了分治法的思想。

第i个顺序统计量：第i个最小的值。

本文将结合一些习题以便更好地讲解本主题。

伪代码：

最坏情况运行时间： O (n^2)

最好情况运行时间： O (1)

期望运行时间： O (n)

算法导论9.2-1中问：“对于上面的randomized_select，一定不会出现长度为0的递归调用”，因为在randomized_select中，我们的目的要求出第i个顺序统计量，因为调用randomized(A,a,b,i)，的条件是A[a,...,b]之间一定有第i个顺序统计量，因此如果调用了长度为0的数组，则与条件矛盾。

接下来要证明为什么期望运行时间是 O (n)。

(下述证明需要假设所有元素都是不相同的)

设随机变量T(n)表示select算法的运行时间，E(T(n))表示select算法的期望运行时间。

我们假设按照最坏情况来讨论，即如果划分了两个子数组后，都调用较长的那个子数组。

T(n)所有的情况如下图所示：