LCA(最近公共祖先)问题的离线算法

来源:互联网 发布:档案数据安全保密制度 编辑:程序博客网 时间:2024/05/18 00:47

1 定义

LCA(Least Common Ancestors):最近公共祖先。对于有根树T的两个结点u、v,最近公共祖先LCA(T,u,v)表示一个结点x,满足x是u、v的祖先且x的深度尽可能大(设树根的深度最小)。另一种理解方式是把T理解为一个无向无环图,而LCA(T,u,v)即u到v的最短路上深度最小的点。这里给出一个LCA的例子:对于T=<V,E>,V={1,2,3,4,5},E={(1,2),(1,3),(3,4),(3,5)},则有:LCA(T,5,2)=1,LCA(T,3,4)=3,LCA(T,4,5)=3。

2 离线算法——Tarjan

        算法设计策略都是基于在执行算法前输入数据已知的基本假设,也就是说,算法在求解问题时已具有与该问题相关的完全信息,通常将这类具有问题完全信息前提下设计出的算法成为离线算法( off line algorithms)(来自http://baike.baidu.com/view/2734232.htm?fr=ala0_1)   

        Tarjan算法是一种用来解决LCA问题的离线算法,它要求在求解前一次读入所有LCA询问(求一个LCA(T,u,v)称为一个LCA询问)。利用并查集优越的时空复杂度,我们可以实现LCA问题的O(n+Q)算法,这里Q表示询问的次数。Tarjan算法基于深度优先搜索的框架,对于新搜索到的一个结点,首先创建由这个结点构成的集合,再对当前结点的每一个子树进行搜索,每搜索完一棵子树,则可确定子树内的LCA询问(即求LCA(T,u,v))都已解决。其他的LCA询问的结果必然在这个子树之外,这时把子树所形成的集合与当前结点的集合合并,并将当前结点设为这个集合的祖先。之后继续搜索下一棵子树,直到当前结点的所有子树搜索完。这时把当前结点也设为已被检查过的,同时可以处理有关当前结点的LCA询问,如果有一个从当前结点到结点v的询问,且v已被检查过,则由于进行的是深度优先搜索,当前结点与v的最近公共祖先一定还没有被检查,而这个最近公共祖先的包涵v的子树一定已经搜索过了,那么这个最近公共祖先一定是v所在集合的祖先。下面给出这个算法的伪代码:

LCA(u) {
  Make-Set(u)
  ancestor[Find-Set(u)]=u/*设置u所在集合的祖先*/
  对于u的每一个孩子v {
   LCA(v)
   Union(v,u)/*把v生成的子集并入u中*/
   ancestor[Find-Set(u)]=u/*防止采用树形启发式合并使u的集合根(代表)变化*/
  }
  checked[u]=true
  对于每个(u,v)属于P {
   if checked[v]=true
   then 回答u和v的最近公共祖先为 ancestor[Find-Set(v)]
  }
}              

上述伪代码中关于并查集的函数Make-Set、Find-Set、Union可以参考本空间中关于并查集的文章:http://hi.baidu.com/ly01kongjian/blog/item/e09057310ff40df31b4cffcb.html

由于是基于深度优先搜索的算法,只要调用LCA(root[T])就可以回答所有的LCA询问了,这里root[T]表示树T的根,假设所有询问(u,v)构成集合P。    

原创粉丝点击