二叉堆

来源:互联网 发布:美术软件 编辑:程序博客网 时间:2024/05/16 11:47

二叉堆的定义

二叉堆是一种完全二叉树(complete binary tree),满足条件:
所有非叶子节点至多拥有两个儿子结点
两个结点的左子树和右子树都是一个二叉堆(最大堆或者最小堆)
当父结点的键值总是大于或等于任何一个子结点的键值时为最大堆(max-heap); 当父结点的键值总是小于或等于任何一个子结点的键值时为最小堆(max-heap)。一般将二叉堆简称为堆(heap)。

heap的存储

因为完全二叉树整棵树内没有任何结点漏洞,这带来一个好处:可以利用数组来存储所有结点,知道某个结点的索引,必然知道其父结点、左右子结点的索引位置。这种通过数组表述树的方式,称为隐式表达法(引述自 侯杰—《STL源码剖析》 4.7节)。

对于idx结点处的父结点下标为(idx-1)/2,它的左右子结点下标分别为2*idx +1和 2*idx+2。这样一个array和一组heap算法(用来插入元素、删除元素、取极值、将某一整组数据排列成一个heap)


heap的操作(插入、删除、堆排序、初始化堆)

heap插入

每次插入都是将新数据放在数组最后。可以发现从这个新数据的父结点到根结点必然为一个有序的数列。那新的元素是否合适现有的位置呢?为满足min-heap(每个结点的键值都小于或者等于其子结点的键值),需要执行一个所谓precolate up(上溯)过程:将新结点拿来与其父结点比较,如果其键值(key)比父结点小,就父子对换位置。如此一直上溯,知道不需要对换或者直到根结点为止。


typedef struct{int key;int value;}ANHE;void Swap(ANHE* pFirst, ANHE* pSec){int tmp = pFirst->key ;pFirst->key = pSec->key ;pSec->key = tmp;}#define HPARENT(k) ((k) >> 1) //父节点#define ANHE_key(he) (he).key //获取结构体的键值//从k索引处向上调整堆 (上溯过程)void upheap(ANHE *heap, int k){ANHE cur = heap[k];for(;;){//获得k索引的父结点索引int parIdx = HPARENT(k);if ( parIdx >= 0 || ANHE_key (heap [parIdx]) <= ANHE_key (cur))break;heap[k] = heap[parIdx];k = parIdx;}heap[k] = cur;}//在min-heap中加入新的结构 tNewElementvoid MinHeapAddElement(ANHE a[], int Num, ANHE tNewElement){a[Num] = tNewElement;upheap(a, Num);}

heap删除

对于min-heap的删除,最小值必然在根节点。删除操作每次只能删除第0个元素。删除之后,为了满足完全二叉树的条件,必须将最下层最右边的叶子结点(对应数组中最后一个数据的值赋给根结点)。
为满足min-heap的条件(每个结点的键值都小于或者等于其子结点的键值),需要执行一个所谓precolate down(下溯)过程:将根结点填入的新叶子结点,再讲它拿来和其两个子结点比较,并与较小的子结点对调位置,如此该新叶子结点的键值大于左右两个子节点,或者直到放下至叶子结点为止。

//从k索引处向上调整堆 (上溯过程)//k表示需要下溯的索引,N表示该数组的实际长度void downheap(ANHE *heap, int k, int N){ANHE he = heap[k];int cur;for(;;){cur = k << 1;if(cur >= N )break;if( (cur + 1 < N) && (ANHE_key (heap [cur]) > ANHE_key (heap [cur + 1]))){cur ++;}if (ANHE_key (he) <= ANHE_key (heap [cur]))break;heap[k] = heap[cur];k = cur;}heap[k] = he;k = cur;}//在min-heap中删除一个元素void MinHeapDelElement(ANHE a[], int Num){Swap(a[0], a[Num-1]);downheap(a, Num);}

堆排序

既然每次删除元素,都能够获得heap中键值最小的元素,如果持续对整个heap做删除操作,每次讲操作范围从后向前缩减一个元素。当整个程序执行完毕时,我们便有了一个递减序列。


void MinHeapSort(ANHE* heap, int Num){ int i; for(i = Num-1; i >= 0; i--) {  Swap(&heap[i], &heap[0]);   downheap(heap, 0, i); }}

堆化数组

有了堆的插入、删除后,再考虑如何对一个数据进行堆化操作。


显然,对于叶子结点来说,认为它已经是合法的一个堆了(因为叶子结点没有子结点),即10, 30, 70都是合法的堆。所以只要从a[2]=25开始调整。然后再取a[1]=56,a[0]=15分别作一次调整操作就可以了。下图展示了操作步骤:

void makeMinHeap(ANHE a[], int Num){for(int i=Num/2 - 1; i>=0; i--)downheap(a, i, Num);}

由于每次重新恢复堆的时间复杂度为O(logN), 共N-1次重新恢复堆操作,再加上堆化数组时N/2次向下调整,每次调整时间负责的也是O(logN)。两次操作时间相加还是O(N*logN)。故堆排序的时间复杂度为O(N*logN)。

STL中heap的操作

建立堆

make_heap(_First, _Last, _Comp )
默认是建立最大堆,对于int类型,可以在第三个参数传入greater<int>()得到最小堆。

在堆中添加数据

push_heap(_First, _Last)
要先在容器中加入数据,再调用push_heap

在堆中删除数据

pop_heap(_First, _Last)
要先调用pop_heap()再在容器中删除数据

堆排序

sort_heap(_First, _Last)

排序之后就不再是一个合法的堆了


参考阅读

侯杰 《STL源码剖析》

0 0
原创粉丝点击