算法导论7.4-5

来源：互联网发布：火箭队勇士知乎编辑：程序博客网时间：2024/05/29 09:53

题目：

当输入数据已经“几乎有序时”，插入排序很快，在实际应用中，我们可以利用这一特点来提高快速排序的速度。当对一个长度小于k的子数组调用快速排序时，让它不做任何排序就返回。当上一层的快速排序调用返回后，对整个数组运行插入排序完成排序过程。证明：这一排序算法的期望时间复杂度为O(nk+nlg(n/k)).

解决方案：

quicksort在递归到只有几个元素大小的数组时开始用插入排序的方法。改进的快速排序方法在

期望时间=原始快排的期望时间+插入排序方法的期望时间。

这里还是要用到7.4（算法导论第7章）的分析方法。对于快排还要计算期望比较次数。

因为被划分在同一个小数组k中的元素，是不会在快排里比较的。所以Xij只要计算那些i和j相差k-1个以上的元素比较就可以了。

定义一个元素集合Zij={zi,zi+1,,,,,,,,zj}

定义一个指示器随机变量Xij=I{zi与zj进行了比较}

E[Xij]=Pr[Xij]=Pr{zi与zj进行了比较}=Pr{zi是Zij的主元}+Pr{zj是Zij的主元}=2/(j-i+1)//因为在快排中，二者能够比较，则其中一个必是主元

快速排序的期望比较次数E[Xij]为

那么快排的期望时间是O(nlg(n/k))，假设优化后的快排产生的小数组大小O(k)，在每个大小O(k)的小数组里使用插入排序，时间复杂度为O(k^2),总共有O(n/k)个小数组，则插入排序时间为O(nk)，。那么把这些时间加起来就是O(nk+nlog(n/k))。

之后对k的取值进行了实验：

使用插入排序优化快速排序的算法实现

实验目的：

快速排序可以按照以下的算法思想优化，并加快快速排序的速度：即当快速排序所划分的子序列的长度小于某个定值k时，该子序列基本有序，可以采用插入排序的办法对子序列进行排序，从而使整体算法的时间复杂度的期望下降为O(nk+nlg(n/k))。本实验的目的是实现该快速排序的优化算法，并且探讨合理的k的取值范围

问题定义

实验总共要解决两个问题

1、优化的快速排序的算法确实能够加速快速排序的速度。

2、讨论k的合理的取值范围。

对于给定规模为n的int[]无序随机数组进行排序，通过实验证明经过优化的快速排序比传统的快排效率要高，并讨论k的值的范围。

实验思想

1、优化快速排序的方法：

a) 在快速的排序的方法中加入判断语句，当high-low<k的时候则调用插入排序的算法，否则继续使用快速排序。

b) 当k<=2时，实质上不调用插入排序，这样就可以得出相同规模的情况下直接使用快速排序所需要的时间。从而便于比较

2、通过考察时间消耗来确定性能的高低

a) 每次计算数据都取一定规模的int 32型无序随机数进行排序，为了避免误差，规模n一定时，不同的k值，都计算5次运算时间，取平均值记录。

b) 使用.net framework 2.0提供的Stopwatch计时器对象，该对象可以将时间间隔精确到0.0001ms。

c) 从理论上得到合理的k值的取值范围是k<=logn.因此在验证取值范围的时候要取到log n 两侧的值。

d) 通过比较时间复杂度来计算性能提升的多少，从而得到加快了快速排序的结论，以及合理的k的取值范围。

测试数据及结果

本测试的硬件以及软件环境如下

CPU：PM 1.5G; 内存:768M;操作系统：windows xp sp2;软件平台：.net 2.0;

1、数组规模为50的时候得到如下数据。

其中第一行为k的取值、第二行为程序运行所需要的时间，单位为ms。

2、数组规模为500的时候得到如下数据。

其中第一行为k的取值、第二行为程序运行所需要的时间，单位为ms。

整体图

局部图

3、数组规模为5000的时候得到如下数据。

其中第一行为k的取值、第二行为程序运行所需要的时间，单位为ms

4、数组规模为50000的时候得到如下数据。

其中第一行为k的取值、第二行为程序运行所需要的时间，单位为ms

5、数组规模为1，000，000的时候得到如下数据。

其中第一行为k的取值、第二行为程序运行所需要的时间，单位为ms

结果分析：

1、由所有的图可以看出，经过优化以后的快速排序比传统快速排序的速度要快，通过数据计算可以排序速度提高了10%-20%左右。

2、通过图示也可以知道当k=logn的时候，其效率提升并不是最大的，在规模不大（例如5个数量级以下）的排序中其最佳的k的取值往往比log n大，一般以8—12之间为最小。

当规模较大时，一般取logn为宜，即使最佳取值超过logn其性能提升也不明显。

3、此后随着k的取值的增大，尤其是超过50之后，时间复杂度明显提升，甚至比快速排序的算法要差。

4、在规模较大的排序过程中快速排序的效率明显好于插入排序。

有可能影响结论的因素：

1、快速取随机数的算法：

a) 在本实验中，所使用的随机数是在10n的整数内取n个无重复的随机数，该算法有可能会影响对实验结果的分析有轻微影响。

2、小规模的数组的分析

a) 对于小规模的数组有可能在快速排序之后得到的子序列的长度小于8,因此直接取8值得商榷。

实验结论

1、经过优化以后的快速排序比传统快速排序的速度要快，通过数据计算可以排序速度提高了10%-20%左右。

2、在规模不大（例如5个数量级以下）的排序中其最佳的k的取值往往比log n大，一般以8—12之间效率最佳。

当规模较大时，k的取值一般取logn为宜，即使最佳取值超过logn其性能提升也不明显。

源代码

优化排序的算法源代码（C#描述）

class SortOp

{ //插入排序

private static void InsertSort(int[] list,int low,int high)

{

for (int i = low; i < high; i++)

{

int t = list[i];

int j = i;

while ((j > 0) && (list[j - 1] > t))

{

list[j] = list[j - 1];

--j;

}

list[j] = t;

}

private static void Swap(ref int i, ref int j)

//只有两个元素时直接交换

{

int t;

t = i;

i = j;

j = t;

}

//快速排序优化

public static void QuickSort(int[] list, int low, int high,int k)

{

//只剩下一个无需交换

if (high <= low)

{

return;

}

else if (high == low + 1)

{

//只剩下两个直接交换

if (list[low] > list[high])

{

Swap(ref list[low], ref list[high]);

return;

}

//大于三个元素开始优化的快速排序

myQuickSort(list, low, high,k);

}

public static void myQuickSort(int[] list, int low, int high,int k)

{

if (low < high)

{

if(high-low<k) //子序列小于k个使用插入排序

{

InsertSort(list,low,high);

}

else{

int pivot = Partition(list, low, high);

myQuickSort(list, low, pivot - 1,k);

myQuickSort(list, pivot + 1, high,k);

}

private static int Partition(int[] list, int low, int high)

{

int pivot;

pivot = list[low];

while (low < high)

{

while (low < high && list[high] >= pivot)

{

high--;

}

if (low != high)

{

Swap(ref list[low], ref list[high]);

low++;

}

while (low < high && list[low] <= pivot)

{

low++;

}

if (low != high)

{

Swap(ref list[low], ref list[high]);

high--;

}

return low;

}

0 0