堆和堆排序

来源:互联网 发布:windows格式化系统 编辑:程序博客网 时间:2024/04/29 15:38

堆,是一棵完全二叉树,根的值大于左右子树中所有结点的值,左右子树也是堆,除此之外,对其它元素之间的大小关系(如左右子树之间元素大小关系)没有要求。这是大根堆,如果把“大于”换成“小于”,就是小根堆,这里都以大根堆为例。

由于堆是完全二叉树,所以可以用数组来模拟,在数据结构上算是比较简单。用数组模拟二叉树(当然也包括堆)的话,如果根节点的下标为0的话,则对于每个结点i,其左孩子下标为2*i+1;其右孩子下标为2*i+2。

 

堆有一个重要的应用是堆排序

堆排序的思想很简单,仍然以大根堆为例。在数组的非降序排序中,需要使用的就是大根堆,因为根据大根堆的性质可知,最大的值一定在堆顶。每次把堆顶最大的元素拿出来,组成有序序列,剩下的再组织成大根堆。

首先要建立一个堆,而建堆的核心内容是调整堆,使二叉树满足堆的定义(每个节点的值都不大于其父节点的值)。调堆的过程应该从最后一个非叶子节点开始,假设有数组A = {1, 3, 4, 5, 7, 2, 6, 8, 0}。那么调堆的过程如下图,数组下标从0开始,A[3] = 5开始。分别与左孩子和右孩子比较大小,如果A[3]最大,则不用调整,否则和孩子中的值最大的一个交换位置,在图1中是A[7] > A[3] > A[8],所以A[3]与A[7]对换,从图1.1转到图1.2。建堆完成之后,堆如图1.7是个大根堆。





其次,排序过程

将待排序区分为无序区和有序区,无序区在前,有序区在后。未排序前无序区为整个待排序区间,没有有序区。排序的过程是,不断地将无序区构造成一个大根堆,这样无序区中的最大元素便被放置在了数组的最前面即根的位置,然后将无序区的第一个元素与最后一个元素交换,此动作将无序区的长度缩小一,将有序区的长度扩大一,即有序区前进一,无序区向前退一。然后将新的无序区(由于根节点的变化,此时很可能已经不是大根堆)重新调整为大根堆,等待下一次的交换。如此往复,不断地将无序区的最大元素添加到有序区的前面,同时缩小无序区,直到有序区占满待排序区为止。由于进行元素交换前,无序区是一个大根堆,即左子树和右子树都是大根堆,所以根节点变化后左右子树仍然都是大根堆,无序区里的最大元素一定在新根节点、左右子树的根节点这三个结点里。先存储新的根节点的值以待后用。如果新的根结点最大,说明已经是大根堆,调整完毕;否则比较左右子树根节点,找出较大的,它是无序区现存的最大元素,应该作为新的大根堆中的根,所以将此节点上调至根节点位置,接下来就只需要调整此结点原来所在的子树为大根堆即可(因为大根堆对左右子树之间元素的大小关系没有要求!)。这是一个迭代的过程,当某一个需要调整的子树调整前就已经是大根堆(待调整的根节点比左右子树根节点都大)时,或者下标已经超出无序区范围时,迭代过程结束,无序区已经调整为大根堆。这就是调整一个左右子树都为大根堆的完全二叉树为大根堆的过程。

如图将A[0] = 8 与 A[heapLen-1]交换,然后heapLen减一,如图2.1,然后调整除最后一个元素的数组为大根堆,如图2.2。如此交换堆的第一个元素和堆的最后一个元素,然后堆的大小heapLen减一,对堆的大小为heapLen的堆进行调堆,如此循环,直到heapLen == 1时停止,最后得一个排序的序列。

 

下面给出代码,根据调整时被调整结点的行为,将调整函数称为SiftUp,并且给出了SiftUp递归和非递归两种算法。


#include <iostream>using namespace std;//使得以i为根的子堆符合堆得性质//i is the root of the heap, and its children is less than arr[i]void SiftUp_digui(int* arr, int i, int size)//递归算法{if(i >= size)return;int lt = 2*i + 1, rt = 2*i + 2;int largest = i;if(lt <= size && arr[largest] < arr[lt])largest = lt;if(rt <= size && arr[largest] < arr[rt])largest = rt;if(largest != i){int tmp = arr[i];arr[i] = arr[largest];arr[largest] = tmp;SiftUp_digui(arr, largest, size);}return;}//使得以i为根的子堆符合堆得性质void SiftUp(int* arr, int i, int size)//非递归算法{int parent = i;int lchild = 2*i + 1, rchild = 2*i + 2;while( lchild <= size | rchild <= size){int largest = parent;if(lchild <= size && arr[largest] < arr[lchild])largest = lchild;if(rchild <= size && arr[largest] < arr[rchild])largest = rchild;if(largest == parent)break;else{int tmp = arr[parent];arr[parent] = arr[largest];arr[largest] = tmp;parent = largest;lchild = largest * 2 + 1;rchild = largest * 2 + 2;}}}//build arr to a heap, arr[0..size],//arr[size] is the last element of the arrryvoid BuildHeap(int* arr, int lastleaf){int lastparent = (lastleaf-1)/2;//i is parent, and its children are 2*i+1 and 2*i+2for( int i = lastparent; i >= 0; --i)//SiftUp_digui(arr, i, lastleaf);SiftUp(arr, i, lastleaf);}void HeapSort(int* arr, int arrlength){int lastleaf = arrlength -1;BuildHeap(arr, lastleaf);for(int i = lastleaf; i > 0;){int tmp = arr[0];arr[0] = arr[i];arr[i] = tmp;//SiftUp_digui(arr, 0, --i);SiftUp(arr,0,--i);}}int main(int argc, char* argv[]){int x6[9] = {1, 3, 4, 5, 7, 2, 6, 8, 0};int x7[12] = {-1, 10, 5, 17, 23, 17, 18, -1, 3, 12, 5, 88};HeapSort(x6, 9);HeapSort(x7, 12);return 0;}