[kotlin·算法]二元选择排序对有序数列排序失败的研究

来源:互联网 发布:mac os dmg u盘制作 编辑:程序博客网 时间:2024/06/04 00:27

    昨天没有更新关于设计模式的文章,因为我答应给朋友写个排序库。桶排、快排、堆排这些常用的比较优良的排序算法很快就写完了,但是却在二元排序上跌了跟头。

    要想解释这个问题,介绍我遇到的这个坑,需要从理解什么是二元选择排序讲起。

>什么是二元选择排序?

    对一个数列ary,要按照升序排列,计其最低位为lo,最高位为hi。扫描整个数列,找到最小值的索引i,找到最大值的索引j,然后把最小值跟最低位交换,把最大值跟最高位交换。

   我最开始的代码是这样的:

    override fun <T> sort(ary: Array<T>) where T : Number, T : Comparable<T> {         for ( i in 0 .. ary.size/2){             var left = i;var right = ary.size-1-i             for(j in i .. ary.size-1-i){                 if ( balance(ary[left], ary[j]) ) {//balance函数就是个比较函数,可比大也可比小,继承自我库里的抽象类                     left = j                 }                 if ( balance(ary[j], ary[right]) ) {                     right = j                 }             }             ary.swap(left, i)//交换值,实际上这一行和下一行这两行代码是有问题的             ary.swap(right, ary.size-1-i)        }    }
    排定一个无序数列,没问题。但当我排定一个有序数列是,程序炸了。
    于是我就去搜了一下为什么,在>这篇文章<中,有这么一段代码:

void SelectSort(int r[],int n) {      int i ,j , min ,max, tmp;      for (i=1 ;i <= n/2;i++) {            // 做不超过n/2趟选择排序           min = i; max = i ; //分别记录最大和最小关键字记录位置          for (j= i+1; j<= n-i; j++) {              if (r[j] > r[max]) {                   max = j ; continue ;               }                if (r[j]< r[min]) {                   min = j ;               }           }          //该交换操作还可分情况讨论以提高效率        tmp = r[i-1]; r[i-1] = r[min]; r[min] = tmp;        tmp = r[n-i]; r[n-i] = r[max]; r[max] = tmp;         }   }  
    首先,这段代码我第一眼就觉得是有问题的,首先其不具备对称的美感:在第二个循环中,j的初始值从i+1开始。这肯定是错的,我们在做双向扫描数列的时候,应该从头到尾扫描,如果从i+1开始,会漏掉i这个值不被队尾过来的游标扫描到。

    其次,最后两行,那些交换语句,也是有问题的,这个问题也就是我遇到的坑。

>我遇到了什么坑?

   让我们考虑这样一数列:[8 7 4]

   现在,lo标记在8上,hi标记在4上,要进行升序排列,那么游标i扫描到了4,游标j扫描到了8,那么经过上面两段最后两行代码的交换,这个数列变成了什么样的呢?答:[8 7 4]。完全没有变化

   看到问题了吗?如果还没看明白,再来看看这个例子:[5 2 1 1 4]

    游标i扫描到了第一个1,游标j扫描到了数字5,经过交换,变成了[4 2 5 1 1]。opps,问题再次出现了:游标i明明要的是1,却得到了4,游标j明明要的是5,却得到了1。那么,假如把上面那两行交换代码的顺序交换一下呢?数列变成了:[1 2 4 1 5],这次正常了。

    如果你足够聪慧,应该已经看到了问题所在:

    在二元扫描中,有两个游标、两个定标,这个四个标任何两个的位置相同,用刚刚提到的那两行swap代码,就会因为交换次序的问题,造成算法程序BUG。

    具体来说有三种"原子"冲突情况:

  • 1.i = hi 且 j = lo,这种情况下会发生两次同位交换,即[8 7 4] ->[4 7 8]->[8 7 4]。解决方法就是,两行交换代码只要执行一行就行了。
  • 2.i = hi ,此时,应先交换i和hi,再交换hi和j。
  • 3.j = lo ,此时,交换顺序应与上面的想反。
    基于这个想法,修改我的Kotlin代码:

//...//上面相同,仅交换代码部分修改if ( left == ary.size-1-i && right == i ) {     ary.swap(left, i)} else if ( left == ary.size-1-i ) {     ary.swap(left, i)     ary.swap(right, ary.size-1-i)} else if ( right == i ) {     ary.swap(right, ary.size-1-i)     ary.swap(left, i)} else {     ary.swap(left, i)     ary.swap(right, ary.size-1-i)}

    再看看测试结果: