基于快排的选择算法:返回数组中第k小的数

来源:互联网 发布:凸优化理论 编辑:程序博客网 时间:2024/05/17 03:36

快速排序的随机化版本

    我们上篇对快排进行了讨论,我们知道它的平均性能是nlgn,但是我们分析的前提是:输入数据的所有排列都是等概率的。但是在实际的工程中,这个假设并不会总是成立,当面对大数据输入的快排时,我们所分析的平均性能不能实现,所以,我们只能通过显性的对输入数据进行重新排列,来使得算法实现的随机化。    基于随机化的快排:
int randomized_partition(int *a,int p,int r){    int i=rand()%(r-p+1)+p;     //get a random num from p to r    swap(a[i],a[r]);           //get random pivot    int key=a[r];    int m=p-1;    for(int j=p;j<r;j++)    {        if(a[j]<key)        {            m+=1;            swap(a[j],a[m]);        }    }    swap(a[m+1],a[r]);    return m+1;}
    后面的递归与上篇相同,这里不做赘述,现在我们可以考虑一下数组中第k小的数,我们从上面的函数可以看出,第一个主元找到了自己的位置是第m+1-p+1小的数,如果m+1-p+1==k,那么我们就找到了想找的数,如果m+1-p+1<k,那么说明该数在m+1后面的数组里,是第k-(m+1-p+1)小的数,如果m+1-p+1>k,那么说明我们要找的数在前面的数组里,还是第k小。    代码实现如下:
int randomized_select(int *a,int p,int r,int k){    if(p==r)        return a[p];    int q=randomized_partition(a,p,r);    int i=q-p+1;    if(i==k)        return a[q];    else if(i<k)             return randomized_select(a,q+1,r,k-i);         else             return randomized_select(a,p,q-1,k);}
    我们可以计算出,它的时间复杂度是O(nlgn)。
0 0