基于快排的选择算法：返回数组中第k小的数

来源：互联网发布：凸优化理论编辑：程序博客网时间：2024/05/17 03:36

快速排序的随机化版本

    我们上篇对快排进行了讨论，我们知道它的平均性能是nlgn，但是我们分析的前提是：输入数据的所有排列都是等概率的。但是在实际的工程中，这个假设并不会总是成立，当面对大数据输入的快排时，我们所分析的平均性能不能实现，所以，我们只能通过显性的对输入数据进行重新排列，来使得算法实现的随机化。    基于随机化的快排：

int randomized_partition(int *a,int p,int r){    int i=rand()%(r-p+1)+p;     //get a random num from p to r    swap(a[i],a[r]);           //get random pivot    int key=a[r];    int m=p-1;    for(int j=p;j<r;j++)    {        if(a[j]<key)        {            m+=1;            swap(a[j],a[m]);        }    }    swap(a[m+1],a[r]);    return m+1;}

    后面的递归与上篇相同，这里不做赘述，现在我们可以考虑一下数组中第k小的数，我们从上面的函数可以看出，第一个主元找到了自己的位置是第m+1-p+1小的数，如果m+1-p+1==k,那么我们就找到了想找的数，如果m+1-p+1<k，那么说明该数在m+1后面的数组里，是第k-(m+1-p+1)小的数，如果m+1-p+1>k，那么说明我们要找的数在前面的数组里，还是第k小。    代码实现如下：

int randomized_select(int *a,int p,int r,int k){    if(p==r)        return a[p];    int q=randomized_partition(a,p,r);    int i=q-p+1;    if(i==k)        return a[q];    else if(i<k)             return randomized_select(a,q+1,r,k-i);         else             return randomized_select(a,p,q-1,k);}

    我们可以计算出，它的时间复杂度是O(nlgn)。

0 0