排序算法

来源：互联网发布：无法连接到网络驱动器编辑：程序博客网时间：2024/05/19 22:03

排序算法
- 概述
- 插入排序
  - 1 直接插入排序Straight Insertion Sort
  - 2 希尔排序Shells Sort
- 选择排序
  - 1 简单选择排序Simple Selection Sort
  - 2 堆排序Heap Sort
- 交换排序
  - 1 冒泡排序Bubble Sort
  - 2 快速排序Quick Sort

排序算法

概述

排序分为：内部排序和外部排序。
- 内部排序：数据记录在内存中进行排序
- 外部排序：因数据过大，无法一次容纳全部的排序记录，在排序过程中需要使用外存

当n较大时，应采用时间复杂度为O(nlog2n)的方法：快速排序1、堆排序、归并排序

说明：
程序中数据都存储于vector中，编译工具为vs2013，使用C++11标准，头文件有：

#include <iostream>#include <vector>#include <algorithm>

打印函数print代码如下：

template <typename T>void print(vector<T> v) {    for (auto iter : v)        cout << iter << " ";    cout << endl;}

1. 插入排序

1.1 直接插入排序(Straight Insertion Sort)

基本思想：
将一个记录插入到已排序好的有序表中，从而得到一个新，记录数增1的有序表。即：先将序列的第1个记录看成是一个有序的子序列，然后从第2个记录逐个进行插入，直至整个序列有序为止。

要点：设立哨兵，作为临时存储和判断数组边界之用。

直接插入排序示例：

如果碰见一个和插入元素相等的，那么就将它放在相等元素后面，保持了原来的顺序，因此插入排序是稳定的。

算法实现：

//@author:Minertemplate <typename T>void Straight_Insertion_Sort(vector<T> &a, int n) {    for (int i = 1; i < n; ++i) {        if (a[i] < a[i - 1]) {            int j = i - 1;            T temp = a[i];            a[i] = a[j];            while (j >= 0 && temp < a[j]) {                a[j + 1] = a[j];                --j;            }            a[j + 1] = temp;        }    }}int main() {    vector<int> a = { 3, 1, 5, 7, 2, 4, 9, 6 };    cout << "排序前：";    print(a);    Straight_Insertion_Sort(a, 8);    cout << "排序后：";    print(a);    return 0;}

直接插入排序结果

效率分析：
时间复杂度：O(n2)
空间复杂度：O(1)
其他的插入排序有：二分插入排序，2-路插入排序

1.2 希尔排序(Shell`s Sort)

希尔排序是1959 年由D.L.Shell 提出来的，相对直接排序有较大的改进。希尔排序又叫缩小增量排序

基本思想：
先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序，待整个序列中的记录“基本有序”时，再对全体记录进行依次直接插入排序。

操作方法：
1. 选择一个增量序列t1,t2,...,tk，其中ti>tj,tk=1;
2. 按增量序列个数k，对序列进行k趟排序；
3. 每趟排序，根据对应的增量ti，将待排序列分割成若干个长度为m的子序列，分别对各子表进行直接插入排序。仅增量因子为1 时，整个序列作为一个表来处理，表长度即为整个序列的长度。

希尔排序示例：

算法实现：
我们简单处理增量序列：增量序列d=n/2,n/4,n/8.....1， n为要排序数的个数
即：先将要排序的一组记录按某个增量d（n/2,n为要排序数的个数）分成若干组子序列，每组中记录的下标相差d.对每组中全部元素进行直接插入排序，然后再用一个较小的增量（d/2）对它进行分组，在每组中再进行直接插入排序。继续不断缩小增量直至为1，最后使用直接插入排序完成排序。

//@author:Minertemplate <typename T>void Shell_Insert_Sort(vector<T> &a, int n, int dk) {    for (int i = dk; i < n; ++i) {        if (a[i] < a[i - dk]) {            int j = i - dk;            T x = a[i];            a[i] = a[i - dk];            while (j >= 0 && x < a[j]) {                a[j + dk] = a[j];                j -= dk;            }            a[j + dk] = x;        }    }}template <typename T>void Shell_Sort(vector<T> &a, int n) {    int dk = n / 2;    while (dk >= 1) {        Shell_Insert_Sort(a, n, dk);        dk = dk / 2;    }}

代码整理后：

//@author:Minertemplate <typename T>void Shell_Sort1(vector<T> &a, int n) {    if (n <= 1 || a.empty())        return;    for (int div = n / 2; div >= 1; div /= 2) {        for (int i = div; i < n; ++i)            for (int j = i; j >= div && (a[j] < a[j - div]); j -= div)                swap(a[j], a[j - div]);    }}

希尔排序结果

效率分析：
希尔排序时效分析很难，关键码的比较次数与记录移动次数依赖于增量因子序列d的选取，特定情况下可以准确估算出关键码的比较次数和记录的移动次数。目前还没有人给出选取最好的增量因子序列的方法。增量因子序列可以有各种取法，有取奇数的，也有取质数的，但需要注意：增量因子中除1 外没有公因子，且最后一个增量因子必须为1。
空间复杂度：O(1)
希尔排序方法是一个不稳定的排序方法。

2. 选择排序

2.1 简单选择排序(Simple Selection Sort)

基本思想：
在要排序的一组数中，选出最小（或者最大）的一个数与第1个位置的数交换；然后在剩下的数当中再找最小（或者最大）的与第2个位置的数交换，依次类推，直到第n-1个元素（倒数第二个数）和第n个元素（最后一个数）比较为止。

操作方法：
第一趟，从n 个记录中找出关键码最小的记录与第一个记录交换；
第二趟，从第二个记录开始的n-1 个记录中再选出关键码最小的记录与第二个记录交换；
以此类推…..
第i 趟，则从第i 个记录开始的n-i+1 个记录中选出关键码最小的记录与第i 个记录交换，
直到整个序列按关键码有序。

简单选择排序示例：

初始值：      3      1      5      7      2      4      9      6第 1趟：    ( 1 )    3      5      7      2      4      9      6第 2趟：    ( 1      2 )    3      5      7      4      9      6第 3趟：    ( 1      2      3 )    5      7      4      9      6第 4趟：    ( 1      2      3      4 )    5      7      9      6第 5趟：    ( 1      2      3      4      5 )    7      9      6第 6趟：    ( 1      2      3      4      5      6 )    7      9第 7趟：    ( 1      2      3      4      5      6      7 )    9第 8趟：    ( 1      2      3      4      5      6      7      9 )

算法实现：

//@author:Minertemplate<typename T>void Simple_Select_Sort(vector<T> &a, int n) {    for (int i = 0; i < n; ++i) {        int pos = i;        for (int j = i + 1; j < n; ++j)            pos = a[j] < a[pos] ? j : pos;        swap(a[pos], a[i]);    }}

简单选择排序结果

效率分析：
时间复杂度：O(n2)
空间复杂度：O(1)
不稳定排序

简单选择排序的改进——二元选择排序
简单选择排序，每趟循环只能确定一个元素排序后的定位。我们可以考虑改进为每趟循环确定两个元素（当前趟最大和最小记录）的位置,从而减少排序所需的循环次数。改进后对n个数据进行排序，最多只需进行[n/2]趟循环即可。具体实现如下：

//@author:Minertemplate<typename T>void Select_Sort(vector<T> &a, int n) {    for (int i = 0; i <= n / 2; ++i) {        int min = i, max = i;        for (int j = i + 1; j < n - i; ++j) {            min = a[j] < a[min] ? j : min;            max = a[j] > a[max] ? j : max;        }        swap(a[i], a[min]);        swap(a[n - i - 1], a[max]);    }}

2.2 堆排序(Heap Sort)

堆排序是一种树形选择排序，是对直接选择排序的有效改进。

基本思想：
堆的定义如下：具有n个元素的序列(k1,k2,...,kn)，当且仅当满足：

由堆的定义可以看出，堆顶元素（即第一个元素）必为最小项（小顶堆）。
若以一维数组存储一个堆，则堆对应一棵完全二叉树，且所有非叶结点的值均不大于(或不小于)其子女的值，根结点（堆顶元素）的值是最小(或最大)的。如：
(a) 大顶堆序列：( 96, 83, 27, 38, 11, 09)
(b) 小顶堆序列：( 12, 36, 24, 85, 47, 30, 53, 91)

初始时把要排序的n个数的序列看作是一棵顺序存储的二叉树（一维数组存储二叉树），调整它们的存储序，使之成为一个堆，将堆顶元素输出，得到n 个元素中最小(或最大)的元素，这时堆的根节点的数最小（或者最大）。然后对前面(n-1)个元素重新调整使之成为堆，输出堆顶元素，得到n 个元素中次小(或次大)的元素。依此类推，直到只有两个节点的堆，并对它们作交换，最后得到有n个节点的有序序列。称这个过程为堆排序。

堆排序示例：

初始化堆：

不断交换首尾元素，重建堆。
1与8交换

排序最终结果：

想要实现堆排序需解决两个问题：
1. 如何将n 个待排序的数建成堆；
2. 输出堆顶元素后，怎样调整剩余n-1 个元素，使其成为一个新堆。

首先讨论第二个问题：输出堆顶元素后，对剩余n-1元素重新建成堆的调整过程。
调整小顶堆的方法：
1. 设有m 个元素的堆，输出堆顶元素后，剩下m-1 个元素。将堆底元素送入堆顶（最后一个元素与堆顶进行交换），堆被破坏，其原因仅是根结点不满足堆的性质。
2. 将根结点与左、右子树中较小元素的进行交换。
3. 若与左子树交换：如果左子树堆被破坏，即左子树的根结点不满足堆的性质，则重复方法 2.
4. 若与右子树交换，如果右子树堆被破坏，即右子树的根结点不满足堆的性质。则重复方法2.
5. 继续对不满足堆性质的子树进行上述交换操作，直到叶子结点，堆被建成。
称这个自根结点到叶子结点的调整过程为筛选。如图：

再讨论对n 个元素初始建堆的过程。
建堆方法：对初始序列建堆的过程，就是一个反复进行筛选的过程。
1. n 个结点的完全二叉树，则最后一个结点是第[n/2]个结点的子树。
2. 筛选从第[n/2]个结点为根的子树开始，该子树成为堆。
3. 之后向前依次对各结点为根的子树进行筛选，使之成为堆，直到根结点。
如图建堆初始过程：无序序列：（49，38，65，97，76，13，27，49）

算法实现：
从算法描述来看，堆排序需要两个过程，一是建立堆，二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数，二是反复调用渗透函数实现排序的函数。

//@author:Miner//堆排序//整理节点time:O(lgn)template<typename T>void MinHeapify(vector<T> &arry, int size, int element) {    int lchild = element * 2 + 1, rchild = lchild + 1;//左右子树    while (rchild < size) {//子树均在范围内        if (arry[element] <= arry[lchild] && arry[element] <= arry[rchild])//如果比左右子树都小，完成整理            return;        if (arry[lchild] <= arry[rchild]) {//如果左边最小            swap(arry[element], arry[lchild]);//把左面的提到上面            element = lchild;//循环时整理子树        }        else {//否则右面最小            swap(arry[element], arry[rchild]);//同理            element = rchild;        }        lchild = element * 2 + 1;        rchild = lchild + 1;//重新计算子树位置    }    if (lchild < size&&arry[lchild] < arry[element])//只有左子树且子树小于自己        swap(arry[lchild], arry[element]);    return;}//堆排序time:O(nlgn)template<typename T>void HeapSort(vector<T> &arry, int size) {    int i;    for (i = size - 1; i >= 0; i--)//从子树开始整理树        MinHeapify(arry, size, i);    while (size > 0) {//拆除树        swap(arry[size - 1], arry[0]);//将根（最小）与数组最末交换        --size;//树大小减小        MinHeapify(arry, size, 0);//整理树    }    return;}

堆排序结果
小顶堆排序完成后生成降序序列

效果分析：
设树深度为k，k=[log2n]+1。从根到叶的筛选，元素比较次数至多2(k-1)次，交换记录至多k 次。所以，在建好堆后，排序过程中的筛选次数不超过下式：

2([log2(n−1)]+[log2(n−2)]+⋅⋅⋅+log22)<2n([log2n)]
而建堆时的比较次数不超过4n 次，因此堆排序最坏情况下，时间复杂度也为：O(nlog2n)。
注：上式中均为下取整
时间复杂度：O(nlog2n)
空间复杂度：O(1)
不稳定排序

3. 交换排序

3.1 冒泡排序(Bubble Sort)

基本思想：
在要排序的一组数中，对当前还未排好序的范围内的全部数，自上而下对相邻的两个数依次进行比较和调整，让较大的数往下沉，较小的往上冒。即：每当两相邻的数比较后发现它们的排序与排序要求相反时，就将它们互换。

冒泡排序示例：

算法实现：

//@author:Minertemplate<typename T>void BubbleSort(vector<T> &a, int n) {    for (int i = 0; i < n - 1; ++i) {        for (int j = 0; j < n - i - 1; ++j)            if (a[j] > a[j + 1])                swap(a[j], a[j + 1]);    }}

冒泡排序结果

冒泡排序算法的改进
对冒泡排序常见的改进方法是加入一标志性变量exchange，用于标志某一趟排序过程中是否有数据交换，如果进行某一趟排序时并没有进行数据交换，则说明数据已经按要求排列好，可立即结束排序，避免不必要的比较过程。本文再提供以下两种改进算法：
1. 设置一标志性变量pos,用于记录每趟排序中最后一次进行交换的位置。由于pos位置之后的记录均已交换到位,故在进行下一趟排序时只要扫描到pos位置即可。

//@author:Minertemplate<typename T>void BubbleSort(vector<T> &a, int n) {    int i = n - 1;    while (i > 0) {        int pos = 0;        for (int j = 0; j < i; ++j)            if (a[j] > a[j+1]) {                pos = j;                swap(a[j], a[j + 1]);            }        i = pos;    }}

实际使用中发现，性能提升并没有想象中的那么大。-_-||

传统冒泡排序中每一趟排序操作只能找到一个最大值或最小值,我们考虑利用在每趟排序中进行正向和反向两遍冒泡的方法一次可以得到两个最终值(最大者和最小者) , 从而使排序趟数几乎减少了一半。

//@author:Minertemplate<typename T>void BubbleSort(vector<T> &a, int n) {    int low = 0, high = n - 1;    int tmp, j;    while (low < high) {        for (j = low; j < high; ++j)            if (a[j] > a[j + 1])                swap(a[j], a[j + 1]);        --high;        for (j = high; j > low; --j)            if (a[j] < a[j - 1])                swap(a[j], a[j - 1]);        ++low;        for (auto iter : a)            cout << iter << " ";        cout << endl;    }}

趟数缩小比较明显。 ^o^

3.2 快速排序(Quick Sort)

终于到快排了，在找工作过程中，快排被问到的频率超高，现场写快排是100%的，像美团、去哪儿都让写快排，T_T

基本思想：
1. 选择一个基准元素（通常选择第一个元素或者最后一个元素）
2. 通过一趟排序将待排序的记录分割成独立的两部分，其中一部分记录的元素值均比基准元素值小。另一部分记录的元素值比基准值大
3. 此时基准元素在其排好序后的正确位置
4. 然后分别对这两部分记录用同样的方法继续进行排序，直到整个序列有序。

注：看着就像是不断的挖东墙补西墙，就是挖坑填坑，然后一个个元素就不断的有序了。

快速排序示例：
一趟排序过程：

排序的全过程：

算法实现：
递归实现：

//@author:Minertemplate <typename T>int partition(vector<T> &a, int low, int high) {    T privotKey = a[low];    while (low < high) {        while (low < high && a[high] >= privotKey)  --high;        swap(a[low], a[high]);        while (low < high && a[low] <= privotKey)   ++low;        swap(a[low], a[high]);    }    return low;}template <typename T>void QuickSort(vector<T> &a, int low, int high) {    if (low < high) {        int privotKey = partition(a, low, high);        QuickSort(a, low, privotKey - 1);        QuickSort(a, privotKey + 1, high);    }}

整理后，得到：

//@author:Minertemplate <typename T>void QuickSort(vector<T> &a, int low, int high) {    if (low >= high)        return;    int key = a[low], i = low, j = high;    while (i < j) {        while (i < j && a[j] >= key)    --j;        a[i] = a[j];        while (i < j && a[i] <= key)    ++i;        a[j] = a[i];    }    a[i] = key;    QuickSort1(a, low, i - 1);    QuickSort1(a, i + 1, high);}

快排结果

非递归实现：
非递归实现其实就是将每次partition分得的段的首尾边界坐标保存在栈中。

//@author:Minertemplate <typename T>void QuickSort(vector<T> &a, int low, int high) {    stack<int> st;    if (low < high) {        int mid = partition(a, low, high);        if (low < mid - 1) {            st.push(low);            st.push(mid - 1);        }        if (mid + 1 < high) {            st.push(mid + 1);            st.push(high);        }        while (!st.empty()) {            int q = st.top();            st.pop();            int p = st.top();            st.pop();            mid = partition(a, p, q);            if (p < mid - 1) {                st.push(p);                st.push(mid - 1);            }            if (mid + 1 < q) {                st.push(mid + 1);                st.push(q);            }        }    }}

效果分析：
快速排序是通常被认为在同数量级（O(nlog2n)）的排序方法中平均性能最好的。但若初始序列按关键码有序或基本有序时，快排序反而蜕化为冒泡排序
时间复杂度：O(nlog2n)
空间复杂度：O(nlog2n)
不稳定排序

快排的改进
在本改进算法中,只对长度大于k的子序列递归调用快速排序,让原序列基本有序，然后再对整个基本有序序列用插入排序算法排序。实践证明，改进后的算法时间复杂度有所降低，且当k取值为 8 左右时,改进算法的性能最佳。算法思想如下：

//@author:Minertemplate <typename T>void QSort_improve(vector<T> &a, int low, int high, int k) {    if (high - low > k) {        int pivot = partition(a, low, high);        QSort_improve(a, low, pivot - 1, k);        QSort_improve(a, pivot + 1, high, k);    }}template <typename T>void QuickSort(vector<T> &a, int n, int k) {    QSort_improve(a, 0, n, k);    for (int i = 1; i <= n; ++i) {        int tmp = a[i];        int j = i - 1;        while (j >= 0 && tmp < a[j]) {            a[j + 1] = a[j];            --j;        }        a[j + 1] = tmp;    }}

未完待续。。。

快速排序：是目前基于比较的内部排序中被认为是最好的方法，当待排序的关键字是随机分布时，快排的平均时间最短 ↩

1 0