二叉查找树(BST) | 平衡二叉查找树(AVL) | 红黑树(RBT)

来源:互联网 发布:亚历克斯·张伯伦 知乎 编辑:程序博客网 时间:2024/05/21 22:54

二叉查找树(BST)
特点:对任意节点而言,左子树(若存在)的值总是小于本身,而右子(若存在)的值总是大于本身。
查找:从根开始,小的往左找,大的往右找,不大不小的就是这个节点了;
插入:从根开始,小的往左,大的往右,直到叶子,就插入,
时间复杂度期望为Ο(logn);
删除:如果是叶子节点,直接删除;如果不是,则去找这个节点左子树的最大值,与之交换;如果交换后还不是叶子节点就继续找做字数的最大值,重复操作至成为叶子节点,删除;
左子树如果不存在就去找右子树的最小节点,交换,重复操作,与上同理;

平衡二叉查找树(AVL)
二叉查找树中的Ο(logn),是个期望值,如果出现比较差的情况,比如根节点为1,后依次插入2、3、4、5、6、7、8、9.。。。。那么,数据结构上来说,树就退化为链表了,但概念上还是二叉查找树,那么操作的时间复杂度也就变为了O(n),导致的原因为树不平衡,不对称;
概念:
左高 = 左节点空 ? 0 : (左节点高+1)
右高 = 右节点空 ? 0 : (右节点高+1)
AVL的定义为:ABS(左高 - 右高) <= 1;(ABS求绝对值):即任意节点的左右高的绝对值之差为0/1;

如何是二叉查找树在添加数据的同时保持平衡?

基本思想就是:当在二叉排序树中插入一个节点时,首先检查是否因插入而破坏了平衡,若 破坏,则找出其中的最小不平衡二叉树,在保持二叉排序树特性的情况下,调整最小不平衡子树中节点之间的关系,以达 到新的平衡。所谓最小不平衡子树 指离插入节点最近且以平衡因子的绝对值大于1的节点作为根的子树。

平衡二叉树的添加
LL型:X节点的左高本来就大,插入点还在左子树的左子树上;
这里写图片描述
直接以X的左子树根节点为中心向右旋转;
RR型:X节点的右高本来就大,插入点还在右子树的右子树上;
这里写图片描述
直接以X的右子树根节点为中心向左旋转;
LR型:以上同理不赘述
这里写图片描述
先将左子树左旋转,再整体右旋转;
RL型:
这里写图片描述
先将右子树右旋转,再整体左旋转;
平衡二叉树的删除:
从平衡二叉树中删除节点更为复杂。首先第一步需要找到要删除的节点x,并分情况进行处理:

如果要删除的节点为叶子节点,就找到了要删除的节点
如果要删除的节点为只有一棵子树的节点就找到了要删除的节点
如果要删除的节点既有左子树,又有右子树。。。
与二叉查找树同理:
如果是叶子节点,直接删除;如果不是,则去找这个节点左子树的最大值,与之交换;如果交换后还不是叶子节点就继续找做字数的最大值,重复操作至成为叶子节点,删除;
左子树如果不存在就去找右子树的最小节点,交换,重复操作,与上同理;
然后判断是否破坏了平衡二叉树的平衡;
关键点在于调整过程:
类似于插入,不过也有区别;
以从节点X的左子树删除节点导致其左子树高度降低而需要调整为例进行分析:
删除的左子树,要调整,影响的是右子树,所以要看右子树的状态;
X的右子树的平衡因子为-1;
这里写图片描述
以X为轴,直接进行左旋操作;
X的右子树的平衡因子为0;
这里写图片描述
以X为轴,直接进行左旋操作;
X的右子树的平衡因子为1;
这里写图片描述
先将X的右子树右旋,再以X为轴左旋;

平衡二叉树性能分析
平衡二叉树的性能优势:很显然,平衡二叉树的优势在于不会出现普通二叉查找树的最差情况。其查找的时间复杂度为O(logN)。
平衡二叉树的缺陷:
(1) 很遗憾的是,为了保证高度平衡,动态插入和删除的代价也随之增加。
(2) 所有二叉查找树结构的查找代价都与树高是紧密相关的,能否通过减少树高来进一步降低查找代价呢。我们可以通过多路查找树的结构来做到这一点。
(3) 在大数据量查找环境下(比如说系统磁盘里的文件目录,数据库中的记录查询 等),所有的二叉查找树结构(BST、AVL、RBT)都不合适。如此大规模的数据量(几G数据),全部组织成平衡二叉树放在内存中是不可能做到的。那么把这棵树放在磁盘中吧。问题就来了:假如构造的平衡二叉树深度有1W层。那么从根节点出发到叶子节点很可能就需要1W次的硬盘IO读写。大家都知道,硬盘的机械部件读写数据的速度远远赶不上纯电子媒体的内存。 查找效率在IO读写过程中将会付出巨大的代价。在大规模数据查询这样一个实际应用背景下,平衡二叉树的效率就很成问题了。
红黑树(Red-Black Tree ( RBT))
红黑树实际上是AVL的一种变形,但是其比AVL(平衡二叉搜索树)具有更高的插入效率,当然查找效率会平衡二叉树稍微低一点点,毕竟平衡二叉树太完美了。但是这种查找效率的损失是非常值得的。它的操作有着良好的最坏情况运行时间,并且在实践中是高效的: 它可以在O(log n)时间内做查找,插入和删除,这里的n是树中元素的数目。
性质1 节点是红色或黑色。
性质2 根节点是黑色。
性质3 每个叶节点(NIL节点,空节点)是黑色的。
性质4 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
性质5 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。
这些约束的好处是:保持了树的相对平衡,同时又比AVL的插入删除操作的复杂性要低许多。

注意的点:

红黑树和AVL树的区别在于它使用颜色来标识结点的高度,它所追求的是局部平衡而不是AVL树中的非常严格的平衡

红黑树和平衡二叉树区别如下:
1、红黑树放弃了追求完全平衡,追求大致平衡,在与平衡二叉树的时间复杂度相差不大的情况下,保证每次插入最多只需要三次旋转就能达到平衡,实现起来也更为简单。
2、平衡二叉树追求绝对平衡,条件比较苛刻,实现起来比较麻烦,每次插入新节点之后需要旋转的次数不能预知。

最小二叉平衡树的节点的公式如下 F(n)=F(n-1)+F(n-2)+1 这个类似于一个递归的数列,可以参考Fibonacci数列,1是根节点,F(n-1)是左子树的节点数量,F(n-2)是右子树的节点数量。

阅读全文
0 0
原创粉丝点击