树(Tree)

来源:互联网 发布:cassandra 导出数据库 编辑:程序博客网 时间:2024/05/21 17:49

基本概念

树(tree)是n( n0 )个结点的有限集。n=0时称为空树。在任意一棵非空树中:(1)有且仅有一个特定的称为根(Root)的结点;(2)当 n>1 时,其与结点可分为m( m>0 )个互不相交的有限集 T1,T2,...,Tm,其中每个集合本身又是一棵树,并且称为根的子树(SubTree)。

结点分类

结点拥有的子树数称为结点的度(Degree)。度为0的结点称为叶结点(Leaf)或终端结点。除根结点外,分支结点也称为内部结点。树的度是树内各结点的度的最大值。

结点间关系

结点的子树的根称为该结点的孩子(Child),相应地,该结点成为孩子的双亲(Parent)。同一个双亲的孩子之间互称兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点,反之,以某结点为根的子树的任一结点都称为该结点的子孙。

其他相关概念

结点的层次(Level)从根开始定义起,根为第一层,根的孩子为第二层。双亲在同一层的结点互称为堂兄弟。树中结点的最大层次成为树的深度(Depth)或高度。

若树中结点的各子树堪称从左导游是有次序的,不能互换的,则称该树为有序树,否则称为无序树。

森林(Forest)是m( m0 )棵互不相交的树的集合。

下面比较线性结构和树结构,具体如下:

线性结构 树结构 第一个数据元素:无前驱 根结点:无双亲,唯一 最后一个数据元素:无后继 叶结点:无孩子,可以多个 中间元素:一个前驱,一个后继 中间结点:一个双亲,多个孩子 一对一的关系 一对多的关系

树的抽象数据类型

相比于线性结构,数的操作大不相同,下面给出一些基本和常用操作:

ADT 树(Tree)Data    树是由一个根结点和若干子树构成。树中节点具有相同数据类型及层次关系。Operation   InitTree(*T):构造空树T。   DestoryTree(*T):销毁树T。   CreateTree(*T,definition):按definition中给出树的定义来构造树。   ClearTree(*T):若树T存在,则将树T清为空树。   TreeEmpty(T):若树T为空树,返回true,否则返回false。   TreeDepth(T):返回T的深度。   Root(T):返回T的根结点。   Value(T,cur_e):cur_e是树T中的一个结点,返回此结点的值。   Assign(T,cur_e,value):给树T的结点cur_e赋值为value。   Parent(T,cur_e):若cur_e是树T的非根节点,则返回它的双亲,否则返回空。   LeftChild(T,cur_e):若cur_e是树T的非叶结点,则返回它的最左孩子,否则返回空。   RightSibling(T,cur_e):若cur_e有右兄弟,返回它的右兄弟,否则返回空。   InsertChild(*T,*p,i,c):其中p指向树T的某个结点,i为所指结点p的度加上1,非空树c与T不相交,操作结果为插入c为树T中p指结点的第i棵子树。   DeleteChild(*T,*p,i):其中p指向树T的某个结点,i为所指结点p的度,操作结果为删除T中p所指结点的第i棵子树。

树的存储结构

先说顺序存储结构,用一端地址连续的存储单元依次存储线性表的数据元素,对于线性表来说很自然,但是针对树这样一对多的结构呢?树种某个结点的孩子可以有多个,这就是无论按何种顺序将树中所有节点存储到数组中,结点的存储位置都无法直接反映逻辑关系,简单的顺序存储结构是不能满足树的实现要求的。

不过可以充分利用顺序存储和链式存储结构特点,完全可以实现对树的存储结构的表示。下面介绍三种不同的表示法:双亲表示法、孩子表示法、孩子兄弟表示法。

双亲表示法

假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点在数组中的位置。也就是说,每个结点除了存储自身信息外,还指示了双亲的位置。其中data是数据域,存储结点数据信息,而parent是指针域,存储该结点的双亲在数组中的下标。下面,结点结构定义代码如下:

/*树的双亲表示法结点结构定义*/#define MAX_TREE_SIZE 100typedef int TElemType;  //树结点的数据类型,暂定为整型typedef struct PTNode{  //结点结构   TElemType data;  //结点数据   int parent;  //双亲位置}PTNode;typedef struct{  //树结构   PTNode nodes[MAX_TREE_SIZE];  //结点数组   int r,n;  //根的位置和结点数}PTree;

根结点没有双亲,所以约定根结点的位置域设置为-1,其他结点都存有双亲位置。可以根据结点的parent指针方便地找到其双亲结点,时间复杂度为O(1),直到parent为-1时,表示找到根结点的根,但是要遍历整个结构才能找到结点的孩子。

这样很麻烦,改进一下,增加一个结点最左边孩子的域,也叫长子域,这样就很方便找到结点的孩子,若没有孩子的结点,长子域设置为-1。

当然,也很关注各兄弟间的关系,可以增加一个右兄弟域来体现兄弟关系,若结点存在右兄弟,则记录右兄弟下标,否则赋值为-1。

存储结构的设计是一个非常灵活的过程。一个存储结构设计得是否合理,取决于基于该存储结构的运算是否合适、是否方便,时间复杂度好不好等。

孩子表示法

每个结点有多个指针域,其中每个指针指向一棵子树的根结点,我们把这种方法叫做多重链表表示法。

孩子表示法:把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。

孩子链表的孩子结点中child是数据域,用于存储某个节点在表头数组中下标。next是指针域,用于存储指向某结点的下一个孩子结点的指针。

表头数组的表头结点,其中data是数据域,存储某结点的数据信息。firstchild是头指针域,存储该结点的孩子链表的头指针。

以下面的树为例,其孩子表示法如下:
这里写图片描述

这里写图片描述

孩子表示法的结构定义代码:

/*树的孩子表示法结构定义*/#define MAX_TREE_SIZE 100typedef struct CTNode{ //孩子结点   int child;   struct CTNode *next;}*ChildPtr;typedef struct{ //表头结构   TElemType data;   ChildPtr firstchild;}CTBox;typedef struct{  //树结构   CTBox nodes[MAX_TREE_SIZE];  //结点数组   int r,n;  //根位置和结点数}CTree;

这样的结构无论是查找某个结点的某个孩子或查找某个结点的兄弟,只需要查找这个结点的孩子单链表即可,对于遍历整棵树也是很方便的,对头结点的数组循环即可。但是也存在问题,结点的双亲查找比较麻烦,可以将双亲表示法和孩子表示法综合。如下图所示,双亲孩子表示法:

这里写图片描述

孩子兄弟表示法

任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。

结构定义如下:

/*树的孩子兄弟表示法结构定义*/typedef struct CSNode{   TElemType data;  //数据域   //firstchild为指针域,存储该结点的第一个孩子结点的存储地址,rightchild为指针域,存储该结点的右兄弟结点的存储地址。   struct CSNode *firstchild,*rightchild;  }CSNode,*CSTree;

小结:这种表示法,查找某个结点的某个孩子可以通过firstchild找到此结点的长子,再通过长子结点的rightsib找到其二弟,接着一直下去,直到找到具体的孩子,这个表示法最大的好处就是将一棵复杂的树变成一棵二叉树。当然,若想找某结点的双亲,这个表示也有缺陷。当然,完全可以再增加一个parent指针域来解决快速查找双亲的问题。

0 0
原创粉丝点击