关于计数排序的思考

来源：互联网发布：英剧推荐知乎编辑：程序博客网时间：2024/05/17 04:33

最简单的理解，先不考虑最大值和最小值问题。如果有n个数，数值范围在0~100，放在数组a中。申请一个长度为101的数组c(数组里的数默认都填充了0)。遍历一遍数组a，值是多少，就在c[值]中加1。然后再遍历一遍数组c，从第二项开始，自己=自己+前面一项。这样相当于计数，让c的意义变成:角标代表一个数，这个数在数组a中有多少小于等于它的数。现在申请一个数组b，从末尾遍历一遍数组a(为了稳定性，所以才从末尾遍历的)，查数在数组c中计数是多少，放在数组b中(数组从0开始，所以放在b[c值-1]的位置。因为这个数放置好了，所以计数也应该减一,即c值=c值-1。这两句可以合并成一句b[--c值]。因为--i是先把减1再赋值。)遍历一遍后，数组b就已经是排序好的了。
再来考虑最大值最小值的问题，遍历一遍a即可找到最大值最小值。如果a中数的范围是50~100，那么申请的c中角标是0~49中的数一定是0，没有意义。所以可以采用差值的方法，c角标的含义是:数-最小值。c的大小变成了最大值-最小值+1(加1是因为最小值-最小值等于0)。实现方式跟上面一样，只要注意加减最小值就好。计数排序是针对非负整数的，当数中的最大值和最小值相差不大的时候最好用。计数排序要求元素能够作为数组的下标，自然不能是负数。我的思路是先把负数和非负数分离开来，对负数取绝对值，再对这两组数分别计数排序，最后再把两组数合并。对于浮点数暂时还没有想到好的解决方案。

public static int[] sort(int[]a){int b[]=new int[a.length];int max=a[0],min=a[0];for(int i:a){//找到最大最小值if(i>max){max=i;}if(i<min){min=i;}}int k=max-min+1;//数组长度是极值差+1，因为最小值-最小值=0，范围是0~最大值-最小值int c[]=new int[k];for(int i=0;i<a.length;i++){c[a[i]-min]+=1;//值-最小值}for(int i=1;i<c.length;i++){//计数,c角标代表：值-最小值，c中数代表有多少个不大于这个值的数。c[i]=c[i]+c[i-1];}for(int i=a.length-1;i>=0;--i){//找到a[i]应该在什么位置，根据有多少个数不大于a[i]。b[--c[a[i]-min]]=a[i];//b从0开始放，所以是计数-1；数被放置好了，计数应该-1}return b;}

不过，既然我有了数组c了，数组c的角标就是值-最小值。我只要遍历一遍c，从头到尾，c中的数是几我就输出几遍c的角标+最小值。我还计数干啥啊。这样不论是时间还是空间都化简了，还好理解。~~这种方法可以看做是化简桶排序。所以计数排序的存在意义是什么？为什么查算法总结，很多人都带上了计数排序？~~

经查找，我发现下面这种排序叫鸽巢排序。

    public static void sort(int[]a){        //int b[]=new int[a.length];        int max=a[0],min=a[0];        for(int i:a){//找到最大最小值            if(i>max){                max=i;            }            if(i<min){                min=i;            }        }        int k=max-min+1;//数组长度是极值差+1，因为最小值-最小值=0，范围是0~最大值-最小值        int c[]=new int[k];        for(int i=0;i<a.length;i++){            c[a[i]-min]+=1;//值-最小值        }        int j=0;        for(int i=0;i<c.length;i++){//c中的数表示有几个“角标+最小值”那么大的数        while(c[i]>0){        a[j]=i+min;//一个个数从小到大放到a中        j++;        c[i]--;        }        }    }

鸽巢排序看起来适用性跟计数排序完全一样，且简单、高效、节省空间。但为什么大家提的都是计数排序，很少有说鸽巢排序的？

排序算法的稳定性是指相同的数在排序过后前后顺序不变。我认为排序算法的稳定性意义：如果排的不是整数，比如排的是学生，先按学号排序，再按成绩排序。如果排序算法是稳定的，那么排出来的效果是相同成绩的学生按学号排序了。如果算法不稳定，排出来的效果是相同成绩的学生随便排序。计数排序只能排整数，那么为什么要在乎它的稳定性？是我对稳定性的意义理解错了？还是计数排序不只是能排整数？如果是第二个原因，也就可以理解为什么普遍了解的都是计数排序了。但是，计数排序如何实现对其他类型进行排序呢？

0 0