快速排序算法

来源:互联网 发布:报纸版面编辑软件 编辑:程序博客网 时间:2024/04/30 19:00

快速排序(Quicksort)是对冒泡排序的一种改进。由C. A. R. Hoare在1962年提出。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。

 

算法过程  设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用第一个数据)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。值得注意的是,快速排序不是一种稳定的排序算法,也就是说,多个相同的值的相对位置也许会在算法结束时产生变动。

  一趟快速排序的算法是:

  1)设置两个变量I、J,排序开始的时候:I=0,J=N-1;

  2)以第一个数组元素作为关键数据,赋值给key,即 key=A[0];

  3)从J开始向前搜索,即由后开始向前搜索(J=J-1),找到第一个小于key的值A[J],并与A[I]交换;

  4)从I开始向后搜索,即由前开始向后搜索(I=I+1),找到第一个大于key的A[I],与A[J]交换;

  5)重复第3、4、5步,直到 I=J; (3,4步是在程序中没找到时候j=j-1,i=i+1,直至找到为止。找到并交换的时候i, j指针位置不变。另外当i=j这过程一定正好是i+或j-完成的最后另循环结束)

  例如:待排序的数组A的值分别是:(初始关键数据:X=49) 注意关键X永远不变,永远是和X进行比较,无论在什么位子,最后的目的就是把X放在中间,小的放前面大的放后面。

  A[0] 、 A[1]、 A[2]、 A[3]、 A[4]、 A[5]、 A[6]:

  49 38 65 97 76 13 27

  进行第一次交换后: 27 38 65 97 76 13 49

  ( 按照算法的第三步从后面开始找)

  进行第二次交换后: 27 38 49 97 76 13 65

  ( 按照算法的第四步从前面开始找>X的值,65>49,两者交换,此时:I=3 )

  进行第三次交换后: 27 38 13 97 76 49 65

  ( 按照算法的第五步将又一次执行算法的第三步从后开始找

  进行第四次交换后: 27 38 13 49 76 97 65

  ( 按照算法的第四步从前面开始找大于X的值,97>49,两者交换,此时:I=4,J=6 )

  此时再执行第三步的时候就发现I=J,从而结束一趟快速排序,那么经过一趟快速排序之后的结果是:27 38 13 49 76 97 65,即所以大于49的数全部在49的后面,所以小于49的数全部在49的前面。

  快速排序就是递归调用此过程——在以49为中点分割这个数据序列,分别对前面一部分和后面一部分进行类似的快速排序,从而完成全部数据序列的快速排序,最后把此数据序列变成一个有序的序列,根据这种思想对于上述数组A的快速排序的全过程如图6所示:

  初始状态 {49 38 65 97 76 13 27}

  进行一次快速排序之后划分为 {27 38 13} 49 {76 97 65}

  分别对前后两部分进行快速排序 {27 38 13} 经第三步和第四步交换后变成 {13 27 38} 完成排序。

  {76 97 65} 经第三步和第四步交换后变成 {65 76 97} 完成排序。

 

变种算法  快速排序(Quicksort)有几个值得一提的变种算法,这里进行一些简要介绍:

  随机化快排:快速排序的最坏情况基于每次划分对主元的选择。基本的快速排序选取第一个元素作为主元。这样在数组已经有序的情况下,每次划分将得到最坏的结果。一种比较常见的优化方法是随机化算法,即随机选取一个元素作为主元。这种情况下虽然最坏情况仍然是O(n^2),但最坏情况不再依赖于输入数据,而是由于随机函数取值不佳。实际上,随机化快速排序得到理论最坏情况的可能性仅为1/(2^n)。所以随机化快速排序可以对于绝大多数输入数据达到O(nlogn)的期望时间复杂度。一位前辈做出了一个精辟的总结:“随机化快速排序可以满足一个人一辈子的人品需求。”

  随机化快速排序的唯一缺点在于,一旦输入数据中有很多的相同数据,随机化的效果将直接减弱。对于极限情况,即对于n个相同的数排序,随机化快速排序的时间复杂度将毫无疑问的降低到O(n^2)。解决方法是用一种方法进行扫描,使没有交换的情况下主元保留在原位置。

  平衡快排(Balanced Quicksort):每次尽可能地选择一个能够代表中值的元素作为关键数据,然后遵循普通快排的原则进行比较、替换和递归。通常来说,选择这个数据的方法是取开头、结尾、中间3个数据,通过比较选出其中的中值。取这3个值的好处是在实际问题(例如信息学竞赛……)中,出现近似顺序数据或逆序数据的概率较大,此时中间数据必然成为中值,而也是事实上的近似中值。万一遇到正好中间大两边小(或反之)的数据,取的值都接近最值,那么由于至少能将两部分分开,实际效率也会有2倍左右的增加,而且利于将数据略微打乱,破坏退化的结构。

  外部快排(External Quicksort):与普通快排不同的是,关键数据是一段buffer,首先将之前和之后的M/2个元素读入buffer并对该buffer中的这些元素进行排序,然后从被排序数组的开头(或者结尾)读入下一个元素,假如这个元素小于buffer中最小的元素,把它写到最开头的空位上;假如这个元素大于buffer中最大的元素,则写到最后的空位上;否则把buffer中最大或者最小的元素写入数组,并把这个元素放在buffer里。保持最大值低于这些关键数据,最小值高于这些关键数据,从而避免对已经有序的中间的数据进行重排。完成后,数组的中间空位必然空出,把这个buffer写入数组中间空位。然后递归地对外部更小的部分,循环地对其他部分进行排序。

  三路基数快排(Three-way Radix Quicksort,也称作Multikey Quicksort、Multi-key Quicksort):结合了基数排序(radix sort,如一般的字符串比较排序就是基数排序)和快排的特点,是字符串排序中比较高效的算法。该算法被排序数组的元素具有一个特点,即multikey,如一个字符串,每个字母可以看作是一个key。算法每次在被排序数组中任意选择一个元素作为关键数据,首先仅考虑这个元素的第一个key(字母),然后把其他元素通过key的比较分成小于、等于、大于关键数据的三个部分。然后递归地基于这一个key位置对“小于”和“大于”部分进行排序,基于下一个key对“等于”部分进行排序。

 

public class QuickSort {
 public static void sort(
  Comparable[] data, int low, int high) {
  // 枢纽元,一般以第一个元素为基准进行划分
   int i = low;
  int j = high;
   if (low < high) {
    // 从数组两端交替地向中间扫描
    Comparable pivotKey = data[low];
    // 进行扫描的指针i,j;i从左边开始,j从右边开始
    while (i < j) {
     while (i < j && data[j].compareTo(pivotKey) > 0) {
      j--;
     }// end while
     if (i < j) {
      // 比枢纽元素小的移动到左边
      data[i] = data[j];
      i++;
     }// end if
     while (i < j && data[i].compareTo(pivotKey) < 0) {
      i++;
     }// end while
     if (i < j) {
      // 比枢纽元素大的移动到右边
      data[j] = data[i];
      j--;
     }// end if
    }// end while
    // 枢纽元素移动到正确位置
    data[i] = pivotKey;
    // 前半个子表递归排序
    sort(data, low, i - 1);
    // 后半个子表递归排序
    sort(data, i + 1, high);
   }// end if
  }// end sort
  public static void main(String[] args) {
   // 在JDK1.5版本以上,基本数据类型可以自动装箱
   // int,double等基本类型的包装类已实现了Comparable接口
   Comparable[] c = { 4, 9, 23, 1, 45, 27, 5, 2 };
   sort(c, 0, c.length - 1);
   for (Comparable data : c) {
    System.out.println(data);
   }
  }
}

原创粉丝点击