数据结构与算法分析-排序

来源:互联网 发布:网络用词飙车什么意思 编辑:程序博客网 时间:2024/05/08 19:00

作者:xiabodan 出处:http://blog.csdn.net/xiabodan 

排序算法(Sorting Algorithm)是计算机算法的一个组成部分。也是程序=算法+数据结构中的一部分(算法)。

实验平台:raspberry 2 B + Ubuntu Mate 

插入排序

外循环i由1到N-1,内循环由j由i到1,每次内循环都将A【j】插入到序列A【0】-A【i】的正确位置,这样就保证了每次外循环之后序列A【0】-A【i】都是已经排好序的,外循环仅仅是将自己插入在A【0】-A【i】之间,且不影响原来的序列正确性。和冒泡算法一样都要经过O(N^2)次比较和交换,如下图


//插入排序//stable//O(N^2) comparisons and swaps//Adaptive: O(n) time when nearly sorted//Very low overheadvoid insertion(elementtype A[],int n){int p = 0 ;int j = 0 ;for(p=1;p<n;p++ ){elementtype tem = A[p] ; for(j=p;j>0&&A[j-1]>tem;j--){ A[j] = A[j-1];}A[j] = tem;}}

希尔排序

希尔排序有时可以成为增量缩小排序,选择一个大小为hk的区间,对相隔hk个元素进行插入排序,逐渐减小hk区间,直至hk变为1

//希尔排序//O(N^3/2)   unstable//Adaptive: O(N.lg(N)) time when nearly sorted//Very low overheadvoid shell(elementtype A[],int n){int i,j,inc;elementtype tem;for(inc=N/2;inc>0;inc /=2){for(i=inc;i<N;i++){tem = A[i];for(j=i;j>=inc;j-=inc){if(tem<A[j-inc])A[j] = A[j-inc];elsebreak;}A[j] = tem;}}}

冒泡排序

冒泡排序比较暴力,外循环i从A【0】-A【N-1】,内循环从A【N-1】-A【i】,同时内循环从末尾开始一直向i靠近,并找出其中最小的元素冒出来到A【i+1】,故称为冒泡排序,十分暴力,但很稳定,需要1+2+3+4+.......+N = N*(N+1) = O(N^2)次比较和交换,效率很低。但是当某次内循环检测到没有发生交换后,说明A【N-1】-A【i】都是按照顺序排列的,不需要排序了。因此如果当给定数据是已经接近排序好的时候,冒泡算法时间复杂度仅为O(N)。
//冒泡排序//O(N^2)   stable//Adaptive: O(N) time when nearly sorted//Very low overheadvoid bubble(elementtype A[],int n){int flag = 1;int i,j;for(i=0;i<n;i++){flag = 0;for(j=n-1;j>i;j--){if(A[j]<A[j-1]){flag = 1;swap(A+j,A+j-1 );}}if(flag == 0) break;}}


选择排序

选择排序,外循环i从A【0】-A【N-1】,内循环从A【i+1】-A【N-1】,内循环负责找出A【i+1】-A【N-1】中比A【i】小的元素,并用一个k去标记它的位置,在内循环结束的时候将A【i】与A【k】互换,那么A【i+1】-A【N-1】中比A【i】小的元素A【k】就被放在了A【i】这个位置。也就是选择一个最小的放在A【i】这个位置。选择排序的比较次数是O(N^2),但是交换次数却只有O(N)。因为内循环每次仅仅是标记最小元素,并没有实时的去交换元素。

//选择排序//Not stable//O(1) extra space//Θ(n2) comparisons//Θ(n) swaps//Not adaptivevoid selection(elementtype A[],int n){int i,j;int k;for(i=0;i<n;i++){k = i;for(j=i+1;j<n;j++){if(A[j]<A[k]){k = j;}}swap(A+i,A+k);}}


快速排序

快速排序是一个典型的分治策略,就是将很大的集合A划分为很小的模块,逐一处理。首先需要选择一个枢纽元素pivot,然后将整个集合A分为两半,一办是都比pivot小的元素,集合Al放在左边;一组是比pivot大的元素都放在右边,叫做集合Ar。然后再对左右边的子集Al与Ar分别采取同样的方法递归,直至集合Al和Ar都只有一个元素,在实际应用中,一般不会让Al和Ar都递归到1个元素,一种要的方法是当Al和Ar小于10(阈值CUT)后,就不在采用快排算法,而是换为插入排序算法效率更高,由于本文测试中不利于大数据的排序,所以仅仅将阈值CUT设置为10。见下图

另外一个问题是枢纽元素pivot的选择,选择枢纽元素pivot的方法有很多,一种常用的就是三数中值算法。也就是选取集合A首尾以及中位元素,然后选取这三个数的中位数作为枢纽元素pivot。


//快速排序//not Stable//O(lg(n)) extra space (see discussion)//O(n2) time, but typically O(n·lg(n)) time//Not adaptive#define CUT 3elementtype median3(elementtype A[],int left ,int right){int center = (left +right) / 2;if(A[left]>A[center])swap(&A[left],&A[center]);if(A[left]>A[right])swap(&A[left],&A[right]);if(A[center]>A[right])swap(&A[center],&A[right]);swap(&A[center],&A[right-1]);return A[right-1];}void Qsort(elementtype A[],int left, int right){int i,j;elementtype pivot;if(left + CUT<= right){pivot = median3(A,left,right); //select middle element as pivoti = left;j = right-1;for(;;){while(A[++i]<pivot){}while(A[--j]>pivot){}if(i<j)swap(&A[i],&A[j]);elsebreak;}swap(&A[i],&A[right-1]);Qsort(A,left,i-1);Qsort(A,i+1,right);}elseinsertion(A+left,right-left+1);}void quick1(elementtype A[],int n){Qsort(A,0,n-1);}


归并排序

归并排序的思想也是(divide-and-conquer)分治策略,将集合A递归均分,直至没组只剩下一个元素时,在开始组合,组合原理如下图很形象,就不多解释。更多关于归并算法可以参见博客http://geeksquiz.com/merge-sort/

//归并排序//Stable//(n) extra space for arrays (as shown)//(lg(n)) extra space for linked lists//(n·lg(n)) time//Not adaptive//Does not require random access to datavoid Merge(elementtype A[],elementtype TA[],int lpos,int rpos,int rightend){int leftend = rpos-1;int numelement = rightend -lpos + 1;int tpos = lpos;while(lpos<=leftend && rpos<=rightend)if(A[lpos] <= A[rpos])TA[tpos++] = A[lpos++];elseTA[tpos++] = A[rpos++];while(lpos<=leftend)TA[tpos++] = A[lpos++];while(rpos<=rightend)TA[tpos++] = A[rpos++];int i = 0;for(i=0;i<numelement;i++,rightend--){A[rightend] = TA[rightend];}}void MSort(elementtype A[],elementtype TA,int left,int right){int center ;if(left < right){center = (left+right)/2;MSort(A,TA,left,center);MSort(A,TA,center+1;right);Merge(A,TA,left,center+1,right);}}void mergesort(elementtype A[],int n){elementtype *TA;TA = (elementtype*)malloc(sizeof(elementtype)); //just malloc once if(NULL != TA){MSort(A,TA,0,n-1);free(TA);}elseprintf("error: TA can't be empty!\n");}



头文件中包含其他的一个变量和打印、交换函数
typedef   int elementtype;#define N 10

//other function used for debugvoid print(elementtype A[],int n)  {int i = 0;printf("after sorting\n");for(i=0;i<n;i++){printf(" %d \n",A[i]);}}
void swap(elementtype *a,elementtype *b){elementtype tem = *a;*a= *b;*b= tem;}



未完待续.......


总结:

     稳定的排序:    插入排序,       冒泡排序,      归并排序
     时间复杂度  :        O(n2)  O(n2)   O(n·lg(n))

     不稳定的排序:选择排序,      希尔排序,       堆排,             快排
     时间复杂度  :        O(n2)  O(n3/2)  O(n·lg(n))  O(n·lg(n))
      
      

     冒泡和插入是慢慢找到最大或最小的放在第一个去;选择直接找到最大或者最小放到第一个;归并、快排都用了devide-merge-conquer(分治策略),期间还是会用到前面提到的那几种最基本的算法;堆排序用了选择排序的思想;桶排序用了空间换时间的方法;万变不离其宗。

参考:

     数据结构与算法分析-C语言描述[M],机械工业出版社

     博客园 vamei的博客:http://www.cnblogs.com/vamei/archive/2013/03/12/2948847.html

         天津城市学院一个精品课程:http://sjjp.tjuci.edu.cn/sjjg/datastructure/ds/web/paixu/paixu8.1.1.1.htm

国外一个排序网站有动画,分析,为代码: http://www.sorting-algorithms.com/

一个在国内不算太有名的国外网站,里面的内容貌似不止算法:
Programming problems and Competitions :: HackerRank
一个俄罗斯的ACM竞赛网站,不定期有算法比赛:
Codeforces
据说是某个Top2大学为后台的算法网站,比较简单,而且一直在定期更新算法入门教程,有定期比赛:
hihoCoder
hdu主办的ACM算法竞赛网站,定期有比赛:
Welcome to BestCoder
宇宙级题库:
UOJ - Universal Online Judge

北大:poj.org/
杭电:acm.hdu.edu.cn/
华中科技大学:acm.hust.edu.cn/vjudge/

1 0