7.7 线索二叉树

来源：互联网发布：配乐朗诵录音软件编辑：程序博客网时间：2024/05/22 20:46

为什么要创建线索二叉树

对于普通含有n个结点的二叉树来说，一共含有2n个指针域，而实际上，树的顶点集中元素的个数V和边集中元素的个数E的关系满足|V|=|E|+1，也就是说在上述二叉树中n=e+1，得e=n−1，共n−1条边，于是只需要n−1个指针就可以刻画这颗二叉树了。但是在采用二叉链存储结构的二叉树来说，对于大多数语言来说，声明一个二叉树结点，必须静态指定两个指针域，分别表示左孩子和右孩子，这样必然会浪费掉n+1个指针，他们指向空，就等于说是完全浪费了。
因此采用线索二叉树，就是在于充分利用这些空余的指针，来提高一种树的常用操作——遍历的效率。不过实际上，往往并不会刻意去构造一颗线索二叉树，在最后会作分析。

基本概念

考虑到二叉树的遍历结果是一个线性序列，因此，很自然地需要一个东西用来表示前驱和后继的关系。
因此定义：线索(thread)是指向当前结点的“前驱”或者“后继”的指针。创建线索的过程称之为线索化。
为了区分一个结点上的指针到底是线索还是实际的孩子，我们需要使用一个辅助标记tag_is_thread，如果为真则为线索，反之指向孩子的指针。在实际实现的过程中，往往还需要一个头结点（哑元），指向树根。

为什么线索二叉树并不常见

首先，较为简单的，也就是书上提到的建立线索的算法，是对于静态集合而言。对于动态插入和删除的树（平衡搜索树），其在集合发生变化时，维持线索的复杂程度要高得多。

为什么STL和linux都使用红黑树作为平衡树的实现？ - 雷鹏的回答 - 知乎
https://www.zhihu.com/question/20545708/answer/31176525

这个回答确实提出，使用线索时，正向遍历效率很高，但是其实现是非常依赖技巧的。它将一棵红黑树的两个结点用数组表示，ltag和rtag标记位用1位二进制分别并在lchild和rchild的31位后面，也就是说child和tag一共才占用一个机器字长。而如果使用二叉链的指针式表示，这是不可能的：指针必须占用一个机器字长，才能对整个地址空间进行寻址。另外再用一个tag，由于内存对齐原因，还要再占用一个机器字长。不同于数据结构课程中理想化考虑tag用作bool布尔型只需要一个二进制位，实际上由于内存对齐的原因，这样反而额外浪费了一倍的空间（ARM架构要求指令必须对齐，而x86虽然可以不对齐，但是取指令就需要两次周期，效率显而易见。）
况且，对于二叉树遍历来说，一旦“碰底”，也就是当前子树处理完毕进行回溯，以中序遍历为例，有左孩子的非叶子结点需要被访问两次（想想非递归，先进栈后出栈），因此，额外增加的时间开销也最多根没有左孩子的非叶子结点个数成正比，最坏的情况不过O(n)，并不会增加渐进复杂度。
该回答中线索提高的效率，属于常数优化，并且和顺序结构代替链式结构，有效地利用了存储器的空间局部性也极大地提高了效率。

阅读全文

0 0

7.7 线索二叉树

为什么要创建线索二叉树

基本概念

相关算法

创建线索

使用线索

为什么线索二叉树并不常见