堆排序

来源:互联网 发布:世界征服者3mac破解版 编辑:程序博客网 时间:2024/05/17 00:07

堆排序是利用堆积树这种数据结构设计的一种算法。

要学习堆排序,我们首先要了解什么是二叉堆:

二叉堆是完全二叉树这这是近似完全二叉树。二叉堆可分为两种形式:最大堆和最小堆。

最大堆的性质是指某个结点的值至多与起父结点的值一样大,最小堆的性质就是指某个节点的值都大于其父结点的值。下图是一个最大堆和一个最小堆。


在堆排序中我们一般使用最大堆。我们要进行堆排序,首先需要把我们的数组转化成一个最大堆,这就是建堆的过程,在建堆过程中,最要中的部分就是怎么维护最大堆的性质。

有时候根结点left(i)和right(i)的二叉树都是最大堆,但是这时有可能A[i],小于它的孩子,这样就违背了最大堆的性质,我们可以通过heapify的过程来保证最大堆的性质:

例如我们给出一个数组a[i] i从1到10

#include<iostream>#include<cstdio>#include<algorithm>using namespace std;void heapify(int a[], int i){    int l = 2*i;    int r = 2*i+1;    int largest;    if(l<=10 && a[l] > a[i])        largest = l;    else        largest = i;    if(r<=10 && a[r] > a[largest])        largest = r;    if(largest != i)    {        swap(a[i], a[largest]);        heapify(a, largest);    }}int main(){    int a[11] = {0, 4, 16, 10, 14, 7, 9, 3, 2, 8, 1};    heapify(a, 1);    for(int i=1;i<11;i++)        cout << a[i] << " ";    return 0;}

操作过程如下图:


我们知道怎样维护最大堆的性质之后,我们就可以用底向上的方法来把一个数组转化为最大堆,这就是我们的建堆过程buildheap:

void buildheap(int a[]){    for(int i=5;i>=1;i--)        heapify(a, i);}
这样我们便将一个数组转化为了最大堆,那么我们最后的堆排序的过程是怎么样的:

通过建堆的过程我们把数组构建成了一个最大堆,对的元素总是在数组的第一个,我们可以通过把它和其他元素互换,将它放到正确的位置,这时如果我们去掉这个节点,在剩下的结点中,原来根的孩子还是最大堆,但是新的根结点有可能违背最大堆的性质,所以我们重复调用heapify过程,直到堆的大小从 n-1降到2,这时我们便完成了排序:

#include<iostream>#include<cstdio>#include<algorithm>using namespace std;int size;int length;void heapify(int a[], int i){    int l = 2*i+1;    int r = 2*i+2;    int largest;    if(l<=size && a[l] > a[i])        largest = l;    else        largest = i;    if(r<=size && a[r] > a[largest])        largest = r;    if(largest != i)    {        swap(a[i], a[largest]);        heapify(a, largest);    }}void buildheap(int a[]){    size = length - 1;    for(int i=length/2-1;i>=0;i--)        heapify(a, i);}void heapsort(int a[]){    buildheap(a);    for(int i=length-1;i>=1;i--)    {        swap(a[0], a[i]);        size--;        heapify(a, 0);    }}int main(){    int a[10] = {4, 1, 3, 2, 16, 9, 10, 14, 8, 7};    length = sizeof(a) / sizeof(int);    heapsort(a);    for(int i=0;i<10;i++)        cout << a[i] << " ";    return 0;}

堆排序的时间,主要由建立初始堆和反复重建堆这两部分的时间开销构成,它们均是通过调用heapify实现的。
平均时间复杂度为:O(N*logN)。
由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
堆排序是就地排序,辅助空间为O(1).
它是不稳定的排序方法。(排序的稳定性是指如果在排序的序列中,存在前后相同的两个元素的话,排序前 和排序后他们的相对位置不发生变化)

0 0