关于计数排序的思考

来源:互联网 发布:英剧推荐 知乎 编辑:程序博客网 时间:2024/05/17 04:33


最简单的理解,先不考虑最大值和最小值问题。如果有n个数,数值范围在0~100,放在数组a中。申请一个长度为101的数组c(数组里的数默认都填充了0)。遍历一遍数组a,值是多少,就在c[值]中加1。然后再遍历一遍数组c,从第二项开始,自己=自己+前面一项。这样相当于计数,让c的意义变成:角标代表一个数,这个数在数组a中有多少小于等于它的数。现在申请一个数组b,从末尾遍历一遍数组a(为了稳定性,所以才从末尾遍历的),查数在数组c中计数是多少,放在数组b中(数组从0开始,所以放在b[c值-1]的位置。因为这个数放置好了,所以计数也应该减一,即c值=c值-1。这两句可以合并成一句b[--c值]。因为--i是先把减1再赋值。)遍历一遍后,数组b就已经是排序好的了。
再来考虑最大值最小值的问题,遍历一遍a即可找到最大值最小值。如果a中数的范围是50~100,那么申请的c中角标是0~49中的数一定是0,没有意义。所以可以采用差值的方法,c角标的含义是:数-最小值。c的大小变成了最大值-最小值+1(加1是因为最小值-最小值等于0)。实现方式跟上面一样,只要注意加减最小值就好。计数排序是针对非负整数的,当数中的最大值和最小值相差不大的时候最好用。计数排序要求元素能够作为数组的下标,自然不能是负数。我的思路是先把负数和非负数分离开来,对负数取绝对值,再对这两组数分别计数排序,最后再把两组数合并。对于浮点数暂时还没有想到好的解决方案。

public static int[] sort(int[]a){int b[]=new int[a.length];int max=a[0],min=a[0];for(int i:a){//找到最大最小值if(i>max){max=i;}if(i<min){min=i;}}int k=max-min+1;//数组长度是极值差+1,因为最小值-最小值=0,范围是0~最大值-最小值int c[]=new int[k];for(int i=0;i<a.length;i++){c[a[i]-min]+=1;//值-最小值}for(int i=1;i<c.length;i++){//计数,c角标代表:值-最小值,c中数代表有多少个不大于这个值的数。c[i]=c[i]+c[i-1];}for(int i=a.length-1;i>=0;--i){//找到a[i]应该在什么位置,根据有多少个数不大于a[i]。b[--c[a[i]-min]]=a[i];//b从0开始放,所以是计数-1;数被放置好了,计数应该-1}return b;}

不过,既然我有了数组c了,数组c的角标就是值-最小值。我只要遍历一遍c,从头到尾,c中的数是几我就输出几遍c的角标+最小值。我还计数干啥啊。这样不论是时间还是空间都化简了,还好理解。这种方法可以看做是化简桶排序。所以计数排序的存在意义是什么?为什么查算法总结,很多人都带上了计数排序?

经查找,我发现下面这种排序叫鸽巢排序。

    public static void sort(int[]a){        //int b[]=new int[a.length];        int max=a[0],min=a[0];        for(int i:a){//找到最大最小值            if(i>max){                max=i;            }            if(i<min){                min=i;            }        }        int k=max-min+1;//数组长度是极值差+1,因为最小值-最小值=0,范围是0~最大值-最小值        int c[]=new int[k];        for(int i=0;i<a.length;i++){            c[a[i]-min]+=1;//值-最小值        }        int j=0;        for(int i=0;i<c.length;i++){//c中的数表示有几个“角标+最小值”那么大的数        while(c[i]>0){        a[j]=i+min;//一个个数从小到大放到a中        j++;        c[i]--;        }        }    }

鸽巢排序看起来适用性跟计数排序完全一样,且简单、高效、节省空间。但为什么大家提的都是计数排序,很少有说鸽巢排序的?

排序算法的稳定性是指相同的数在排序过后前后顺序不变。我认为排序算法的稳定性意义:如果排的不是整数,比如排的是学生,先按学号排序,再按成绩排序。如果排序算法是稳定的,那么排出来的效果是相同成绩的学生按学号排序了。如果算法不稳定,排出来的效果是相同成绩的学生随便排序。计数排序只能排整数,那么为什么要在乎它的稳定性?是我对稳定性的意义理解错了?还是计数排序不只是能排整数?如果是第二个原因,也就可以理解为什么普遍了解的都是计数排序了。但是,计数排序如何实现对其他类型进行排序呢?

0 0