八大排序之希尔排序算法-python实现

来源:互联网 发布:淘宝客推广要什么条件 编辑:程序博客网 时间:2024/06/05 17:28

转自我的博客园!

一、算法描述

简单插入排序很循规蹈矩,不管数组分布是怎么样的,依然一步一步的对元素进行比较,移动,插入,比如[5,4,3,2,1,0]这种倒序序列,数组末端的0要回到首位置很是费劲,比较和移动元素均需n-1次。而希尔排序在数组中采用跳跃式分组的策略,通过某个增量将数组元素划分为若干组,然后分组进行插入排序,随后逐步缩小增量,继续按组进行插入排序操作,直至增量为1。希尔排序通过这种策略使得整个数组在初始阶段达到从宏观上看基本有序,小的基本在前,大的基本在后。然后缩小增量,到增量为1时,其实多数情况下只需微调即可,不会涉及过多的数据移动。

希尔排序首先选择一个元素选择步长将数组划分为若干小组,对各个小组分别进行排序,然后不断将步长缩小,不断分组和排序,直到后的步长为1,对所有的元素进行排序,此时,经过前期的排序工作,能够减少全体元素插入排序的对比次数,大大降低了排序的时间复杂度。

我们来看下希尔排序的基本步骤,在此我们选择增量gap=length/2,缩小增量继续以gap = gap/2的方式,这种增量选择我们可以用一个序列来表示,{n/2,(n/2)/2...1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量

以一个实际的例子说明希尔排序的执行过程:

将数组{13,7,3,8,12,510,2}从小到大进行排序。

第一次分组排序:选择步长8/2=4,图下方的数组表示分组情况

 

第二次排序:选择步长4/2=2;

 

第三次分组排序:选择步长2/2=1;

 

 

二、算法分析

不需要大量的辅助空间,和归并排序一样容易实现。希尔排序是基于插入排序的一种算法, 在此算法基础之上增加了一个新的特性,提高了效率。希尔排序的时间复杂度与增量序列的选取有关,例如希尔增量时间复杂度为O(n²),而Hibbard增量的希尔排序的时间复杂度为O(),希尔排序时间复杂度的下界是n*log2n。希尔排序没有快速排序算法快 O(n(logn)),因此中等大小规模表现良好,对规模非常大的数据排序不是最优选择。但是比O()复杂度的算法快得多。并且希尔排序非常容易实现,算法代码短而简单。 此外,希尔算法在最坏的情况下和平均情况下执行效率相差不是很多,与此同时快速排序在最坏的情况下执行的效率会非常差。专家们提倡,几乎任何排序工作在开始时都可以用希尔排序,若在实际使用中证明它不够快,再改成快速排序这样更高级的排序算法. 本质上讲,希尔排序算法是直接插入排序算法的一种改进,减少了其复制的次数,速度要快很多。 原因是,当n值很大时数据项每一趟排序需要移动的个数很少,但数据项的距离很长。当n值减小时每一趟需要移动的数据增多,此时已经接近于它们排序后的最终位置。 正是这两种情况的结合才使希尔排序效率比插入排序高很多。Shell算法的性能与所选取的分组长度序列有很大关系。只对特定的待排序记录序列,可以准确地估算关键词的比较次数和对象移动次数。

时间复杂度:

在最优的情况下,时间复杂度为:O(n ^ (1.3) )   (元素已经排序好顺序)

在最差的情况下,时间复杂度为:O(n ^ 2);

空间复杂度:

O(1)

由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的

二、源码分析

 

复制代码
 1 #!/usr/bin/python 2 #coding:utf-8 3  4 a=[3,4,1,5,2,9,7,8,6,10,11] 5 print("排序前:"+str(a)) 6 alen=int(len(a)) 7 def shellsort(a): 8     n=alen 9     while(n>0):10         n=n//211         for i in range(n):12             for j in range(i,alen,n):13                 temp=a[j]14                 if(temp<a[j-n]):15                     while((temp<a[j-n]) and j>0):16                         a[j]=a[j-n]17                         j=j-n18                     a[j]=temp19 shellsort(a)20 print("排序后:"+str(a))

原创粉丝点击