算法复习(2) 快速排序

来源:互联网 发布:学生信息管理数据库 编辑:程序博客网 时间:2024/05/02 13:13

关于快速排序,一般都认为是通常情况下性能最好的,也确实是。因此对其的讨论都是在于如何能够使它更快。因此看一下快排的一般版本和随机版本。

//一般版本int Partition(int* arr, int start, int end){    int x = arr[end];    int i = start - 1;    for(int j = start; j < end; ++j)    {        if (arr[j] < x)        {            ++i;            int t = arr[i];            arr[i] = arr[j];            arr[j] = t;        }    }    int t = arr[i+1];    arr[i+1] = arr[end];    arr[end] = t;    return i+1;}void QuickSort(int* arr, int start, int end){    if (start < end)    {        int q = Partition(arr, start, end);        QuickSort(arr, start, q-1);        QuickSort(arr, q+1, end);    }}//随机版本int RandomPartition(int* arr, int start, int end){    int q = start + rand() % (end-start);    int t = arr[q];    arr[q] = arr[end];    arr[end] = t;    return Partition(arr, start, end);}void RandomQuickSort(int* arr, int start, int end){    if (start < end)    {        int q = RandomPartition(arr, start, end);        RandomQuickSort(arr, start, q-1);        RandomQuickSort(arr, q+1, end);    }}

我们一般认为随机取样能够给算法带来更好的平均性能,这意味着在输入足够大的情况下随机版本的性能会趋向于O(nlgn)。

因此我做了一个实验,对20000个大小为2000的随机数组进行排序。使用Release /O2 编译。让人惊讶的是随机版本往往比一般版本多花0.6到0.7秒,也就是差不多要低25%到30%的性能。为什么会这样?

原因是在于随机函数的选择上。之前说到的随机取样能够带来更好的平均性能是建立在随机函数的代价为O(1)的基础上的,然而实际并不一定是。随机函数的代价也是需要考虑进总代价之内的,也就是说随机取样反而可能造成更大的开销。

不过这也不是没有解决办法。假设我拥有一个预先计算好的随机数队列,就可以将随机快排过程中的随机函数代价降低到O(1)。当然如果要把计算随机数队列的开销也纳入总体计算的话,那也不能说代价降低了。这需要视工程实际需求而定。

0 0
原创粉丝点击