归并排序算法解析

来源:互联网 发布:网络后门的功能是 编辑:程序博客网 时间:2024/06/18 18:03

        归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

一次归并算法

1、基本思路
      设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上:R[low..m],R[m+1..high],先将它们合并到一个局部的暂存向量R1(相当于输出堆)中,待合并完成后将R1复制回R[low..high]中。
      合并过程中,设置i,j和p三个指针,其初值分别指向这三个记录区的起始位置。合并时依次比较R[i]和R[j]的关键字,取关键字较小的记录复制到R1[p]中,然后将被复制记录的指针i或j加1,以及指向复制位置的指针p加1。
      重复这一过程直至两个输入的子文件有一个已全部复制完毕(不妨称其为空),此时将另一非空的子文件中剩余记录依次复制到R1中即可。
      实现时,R1是动态申请的,因为申请的空间可能很大,故须加入申请空间是否成功的处理。
2、图形解析

首先我们来讨论归并算法,归并算法将一系列数据放到一个向量中,索引范围为[first,last],这个序列由两个排好序的子表构成,以索引终点(mid)为分界线,以下面一个序列为例

    7,10,19,25,12,17,21,30,48

   这样的一个序列中,分为两个子序列 7,10,19,25  和 12,17,21,30,48,如下图所示:

image

再使用归并算法的时候的步骤如下:

 第一步:比较v[indexA]=7和v[indexB]=12,将较小的v[indexA]取出来放到临时向量tempArray中,然后indexA加1

image

 第二步:比较v[indexA]=10和v[indexB]=12,将较小的10放到临时变量tempArray中,然后indexA++;

  image

第三步:比较v[indexA]=19与v[indexB]=12,将较小的12存放到临时变量tempArray中,然后indexB++;

   image

第四步到第七步:按照以上规则,进行比对和存储,得到如下结果:

   image

最后一步:将子表b中剩余项添加到临时向量tempArray中

   image 

然后将临时变量中的值按照索引位置,拷贝回向量v中,就完成了对向量v的归并排序。

3、算法程序

    void Merge(SeqList R,int low,int m,int high)
     {//将两个有序的子文件R[low..m)和R[m+1..high]归并成一个有序的
      //子文件R[low..high]
      int i=low,j=m+1,p=0; //置初始值
      RecType *R1; //R1是局部向量,若p定义为此类型指针速度更快
      R1=(ReeType *)malloc((high-low+1)*sizeof(RecType));
      if(! R1) //申请空间失败
        Error("Insufficient memory available!");
      while(i<=m&&j<=high) //两子文件非空时取其小者输出到R1[p]上
        R1[p++]=(R[i].key<=R[j].key)?R[i++]:R[j++];
      while(i<=m) //若第1个子文件非空,则复制剩余记录到R1中
        R1[p++]=R[i++];
      while(j<=high) //若第2个子文件非空,则复制剩余记录到R1中
        R1[p++]=R[j++];
      for(p=0,i=low;i<=high;p++,i++)
        R[i]=R1[p];//归并完成后将结果复制回R[low..high]
     } //Merge

4,、实现方法

a、自底向上的方法

      自底向上的基本思想是:第1趟归并排序时,将待排序的文件R[1..n]看作是n个长度为1的有序子文件,将这些子文件两两归并,若n为偶数,则得到n/2个长度为2的有序子文件;若n为奇数,则最后一个子文件轮空(不参与归并)。故本趟归并完成后,前lg n个有序子文件长度为2,但最后一个子文件长度仍为1;第2趟归并则是将第1趟归并所得到的lg n个有序的子文件两两归并,如此反复,直到最后得到一个长度为n的有序文件为止。
      上述的每次归并操作,均是将两个有序的子文件合并成一个有序的子文件,故称其为"二路归并排序"。类似地有k(k>2)路归并排序。
分析:
       在某趟归并中,设各子文件长度为length(最后一个子文件的长度可能小于length),则归并前R[1..n]中共有个有序的子文件:R
[1..length],R[length+1..2length],…。
      调用归并操作将相邻的一对子文件进行归并时,必须对子文件的个数可能是奇数、以及最后一个子文件的长度小于length这两种特殊情况进行特殊处理:
① 若子文件个数为奇数,则最后一个子文件无须和其它子文件归并(即本趟轮空);
② 若子文件个数为偶数,则要注意最后一对子文件中后一子文件的区间上界是n。
具体算法如下:
     void MergePass(SeqList R,int length)
      { //对R[1..n]做一趟归并排序
       int i;
       for(i=1;i+2*length-1<=n;i=i+2*length)
       Merge(R,i,i+length-1,i+2*length-1);
            //归并长度为length的两个相邻子文件
       if(i+length-1<n) //尚有两个子文件,其中后一个长度小于length
          Merge(R,i,i+length-1,n); //归并最后两个子文件
       //注意:若i≤n且i+length-1≥n时,则剩余一个子文件轮空,无须归并
      } //MergePass

   void MergeSort(SeqList R)
    {//采用自底向上的方法,对R[1..n]进行二路归并排序
      int length;
      for(1ength=1;length<n;length*=2) //做趟归并

         MergePass(R,length); //有序段长度≥n时终止
    }


      自底向上的归并排序算法虽然效率较高,但可读性较差。

b、自顶向下的方法
      采用分治法进行自顶向下的算法设计,形式更为简洁。
      设归并排序的当前区间是R[low..high],分治法的三个步骤是:
①分解:将当前区间一分为二,即求分裂点
                 mid=(low+high)/2
②求解:递归地对两个子区间R[low..mid]和R[mid+1..high]进行归并排序;
③组合:将已排序的两个子区间R[low..mid]和R[mid+1..high]归并为一个有序的区间R[low..high]。
   递归的终结条件:子区间长度为1(一个记录自然有序)。
     void MergeSortDC(SeqList R,int low,int high)
      {//用分治法对R[low..high]进行二路归并排序
        int mid;
        if(low<high){//区间长度大于1
           mid=(low+high)/2; //分解
           MergeSortDC(R,low,mid); //递归地对R[low..mid]排序
           MergeSortDC(R,mid+1,high); //递归地对R[mid+1..high]排序
           Merge(R,low,mid,high); //组合,将两个有序区归并为一个有序区
         }
      }//MergeSortDC



 

原创粉丝点击