排序算法集合 -7

来源：互联网发布：北京数据库培训机构编辑：程序博客网时间：2024/06/06 16:56

计数排序

计数排序是一个非基于比较的排序算法，该算法于1954年由 Harold H. Seward 提出。它的优势在于在对一定范围内的整数排序时，它的复杂度为Ο(n+k)（其中k是整数的范围），快于任何比较排序算法。当然这是一种牺牲空间换取时间的做法，而且当O(k)>O(n*log(n))的时候其效率反而不如基于比较的排序（基于比较的排序的时间复杂度在理论上的下限是O(n*log(n)), 如归并排序，堆排序）。

算法思想

计数排序对输入的数据有附加的限制条件：

1、输入的线性表的元素属于有限偏序集S；

2、设输入的线性表的长度为n，|S|=k（表示集合S中元素的总数目为k），则k=O(n)。

在这两个条件下，计数排序的复杂性为O(n)。

计数排序的基本思想是对于给定的输入序列中的每一个元素x，确定该序列中值小于x的元素的个数（此处并非比较各元素的大小，而是通过对元素值的计数和计数值的累加来确定）。一旦有了这个信息，就可以将x直接存放到最终的输出序列的正确位置上。例如，如果输入序列中只有17个元素的值小于x的值，则x可以直接存放在输出序列的第18个位置上。当然，如果有多个元素具有相同的值时，我们不能将这些元素放在输出序列的同一个位置上，因此，上述方案还要作适当的修改。

算法过程

假设输入的线性表L的长度为n，L=L1,L2,..,Ln；线性表的元素属于有限偏序集S，|S|=k且k=O(n)，S={S1,S2,..Sk}；则计数排序可以描述如下：

1、扫描整个集合S，对每一个Si∈S，找到在线性表L中小于等于Si的元素的个数T(Si)；

2、扫描整个线性表L，对L中的每一个元素Li，将Li放在输出线性表的第T(Li)个位置上，并将T(Li)减1。

算法描述

C++语言实现：

#include <iostream>using namespace std;const int MAXN = 100000;const int k = 1000; // rangeint a[MAXN], c[MAXN], ranked[MAXN]; int main() {    int n;    cin >> n;    for (int i = 0; i < n; ++i) {        cin >> a[i];         ++c[a[i]];    }    for (int i = 1; i < k; ++i)        c[i] += c[i-1];    for (int i = n-1; i >= 0; --i)        ranked[--c[a[i]]] = a[i];//如果是i表达的是原数标号，a[i]就是排序后的正确序列    for (int i = 0; i < n; ++i)        cout << ranked[i] << endl;    return 0;}

C语言实现：

#include<stdio.h>#include<stdlib.h> #define MAXNUM 10 void main(){    void CountSort(int data[],int n);    int i,data[MAXNUM];    for(i=0;i<MAXNUM;i++)        scanf("%d",&data[i]);    CountSort(data,MAXNUM);    for(i=0;i<MAXNUM;i++)        printf("%d ",data[i]);    printf("\n");} void CountSort(int data[],int n){    int i,j,count,*data_p;    data_p=(int*)malloc(sizeof(int)*n);    for(i=0;i<n;i++)//初始化data_p        data_p[i]=0;    for(i=0;i<n;i++)    {        count=0;        for(j=0;j<n;j++)//扫描待排序数组            if(data[j]<data[i])//统计比data[i]值小的值的个数                count++;        if(data_p[count]!=0)//对于相等非0的数据，应向后措一位。数据为0时，因数组data_p被初始化为0，故不受影响。            count++;        data_p[count]=data[i];//存放到data_p中的对应位置    }        //用于检查当有多个数相同时的情况    i=0,j=n;    while(i<j)        {        if(data_p[i]==0)                {            temp=i-1;            data_p[i]=data_p[temp];        }//of if        i++;    }//of  while    for(i=0;i<n;i++)//把排序完的数据复制到data中        data[i]=data_p[i];    free(data_p);//释放data_p}

总结

编辑

我们看到，计数排序算法没有用到元素间的比较，它利用元素的实际值来确定它们在输出数组中的位置。因此，计数排序算法不是一个基于比较的排序算法，从而它的计算时间下界不再是Ω(nlogn)。另一方面，计数排序算法之所以能取得线性计算时间的上界是因为对元素的取值范围作了一定限制，即k=O(n)。如果k=n2,n3,..，就得不到线性时间的上界。此外，我们还看到，由于算法第4行使用了downto语句，经计数排序，输出序列中值相同的元素之间的相对次序与他们在输入序列中的相对次序相同，换句话说，计数排序算法是一个稳定的排序算法。

应用

编辑

优化前向星

前向星不需要像邻接表那样用指针指向下一条边，还是挺方便的。但是，由于前向星初始化需要快排一遍，相对邻接表要慢许多。考虑到一般图论题点数都不会很大，所以可以改为采用计数排序的思想对前向星进行排序。

一开始读入时，先算出每个点出去的边有多少条，然后计算出排序后每个点出去的第一条边位置应在哪里，最后把全部边扫一遍放到排序后应在的位置就好了。

这样排序的话初始化的时间复杂度就降到了O(m)，总体时间并不会逊色于邻接表。

优化后缀数组的倍增算法

如果用快速排序，该算法的复杂度为O(nlog^2n)。改用计数排序后，复杂度降为O(nlogn)。

参考资料

1. 计数排序，传说时间复杂度为0(n)的排序．cppblog[引用日期2013-10-09]
2. 计数排序．zh.wikipedia.org[引用日期2012-10-18]
3. 后缀数组．百度百科[引用日期2013-10-09]

阅读全文

0 0