Tarjan

来源：互联网发布：广贵交易软件编辑：程序博客网时间：2024/06/04 18:19

Tarjan求有向图的强连通分量（Tarjan算法描述）

分类：算法整理2011-07-12 23:18 1130人阅读评论(0) 收藏举报

算法struct

强连通分量是有向图中的概念，我们先说强连通分量的定义吧：在一个图的子图中，任意两个点相互可达，也就是存在互通的路径，那么这个子图就是强连通分量（或者称为强连通分支）。如果一个有向图的任意两个点相互可达，那么这个图就称为强连通图。
我们常用的求强连通分量的算法有两个，一个是Kosaraju算法，这个算法是基于两次dfs来实现的；还有一个就是Tarjan算法，这个算法完成一次dfs就可以找到图中的强连通分支。我的这篇文章主要介绍Tarjan算法。
Tarjan算法是基于这样一个原理：如果u是某个强连通分量的根，那么：
（1）u不存在路径可以返回到它的祖先
（2）u的子树也不存在路径可以返回到u的祖先。
因此我们在实现Tarjan算法的时候，使用dfsnum[i]记录节点i被访问的时间，也可以理解为在访问该点之前已经访问的点的个数。然后使用数组low[i]记录点i或者i的子树最小可以返回到的节点（在栈中）的次序号。
这里还要说一下low[i]的更新过程，
if(v是i向下dfs的树边) low[i]=min(low[i],low[v]);//这里也就是说low[i]表示i或者i的子树所能追回到的最小的点序号。
if(v不是树边也不是横叉边) low[i]=min(low[i],dfsnum[v]);//其实这里你直接更新成low[v]代替dfsnum[v]也是可以的
根据上面的原理，我们可以发现只有当dfsnum[i]==low[i]的时候就正好是强连通分量的根。这个时候我们把在栈中的点（在遇到根之前在栈中的点）出栈，并且标记好点所属的强连通分支的编号。
整个Tarjan算法跑下来就可以完成强连通分支的求解了。
下面我贴上我的在HDU 1269上判断一个图是否是强连通图的代码，这个代码其实就完成了Tarjan算法，最后只要简单判断下整个图是否是只有一个强连通分支就可以了。
[cpp] view plaincopy
#include <string.h>
#include <stdio.h>
#include <stdlib.h>
#define MAX 100010
int dfsnum[MAX],dfsNum,low[MAX];
int sccnum[MAX],sccNum;
int instack[MAX],st[MAX],top;

typedef struct EDGE
{
    int v,next;
}edge;
edge e[MAX];
int edgeNum;
int head[MAX];

void insertEdge(int a,int b)
{
    e[edgeNum].v=b;
    e[edgeNum].next=head[a];
    head[a]=edgeNum++;
}

void Tarjan(int i)
{
    dfsnum[i]=low[i]=++dfsNum;
    st[top++]=i;
    instack[i]=1;
    int j=head[i];
    for(j=head[i];j!=-1;j=e[j].next)
    {
        int v=e[j].v;
        if(dfsnum[v]==0)//为树边
        {
            Tarjan(v);
            if(low[i]>low[v])
                low[i]=low[v];
        }
        else if(instack[v])
        {
            if(low[i]>dfsnum[v])
                low[i]=dfsnum[v];
        }
    }
    if(dfsnum[i]==low[i])
    {
        do
        {
            top--;
            sccnum[st[top]]=sccNum;
            instack[st[top]]=0;
        }while(top>=0&&st[top]!=i);
        sccNum++;
    }
}
void solve(int n)
{
    int i;
    memset(dfsnum,0,sizeof(dfsnum));
    memset(instack,0,sizeof(instack));
    dfsNum=0;
    top=0;
    sccNum=0;
    for(i=1;i<=n;i++)
    {
        if(dfsnum[i]==0)
            Tarjan(i);
    }
}
int main()
{
    int n,m;
    int a,b,i;
    while(scanf("%d %d",&n,&m))
    {
        if(m==0&&n==0)
            break;
        memset(head,-1,sizeof(head));
        edgeNum=0;
        for(i=0;i<m;i++)
        {
            scanf("%d %d",&a,&b);
            insertEdge(a,b);
        }
        solve(n);
        if(sccNum==1)
            printf("Yes\n");
        else
            printf("No\n");
    }
    return 0;
}

（算法）Tarjan离线算法解决LCA问题（附POJ 1470 Closest Common Ancestors 代码）
分类：算法整理2011-07-15 22:25 1261人阅读评论(0) 收藏举报
算法cini
对于最近公共祖先问题，我们先来看这样一个性质，当两个节点（u，v）的最近公共祖先是x时，那么我们可以确定的说，当进行后序遍历的时候，必然先访问完x的所有子树，然后才会返回到x所在的节点。这个性质就是我们使用Tarjan算法解决最近公共祖先问题的核心思想。
同时我们会想这个怎么能够保证是最近的公共祖先呢？我们这样看，因为我们是逐渐向上回溯的，所以我们每次访问完某个节点x的一棵子树，我们就将该子树所有节点放进该节点x所在的集合，并且我们设置这个集合所有元素的祖先是该节点x。那么到我们完成对一个节点的所有子树的访问时，我们将这个节点标记为已经找到了祖先的点。
这个时候就体现了Tarjan采用离线的方式解决最近公共祖先的问题特点所在了，所以这个时候就体现了这一点。假设我们刚刚已经完成访问的节点是a，那么我们看与其一同被询问的另外一个点b是否已经被访问过了，若已经被访问过了，那么这个时候最近公共祖先必然是b所在集合对应的祖先c，因为我们对a的访问就是从最近公共祖先c转过来的，并且在从c的子树b转向a的时候，我们已经将b的祖先置为了c，同时这个c也是a的祖先，那么c必然是a、b的最近公共祖先。
对于一棵子树所有节点，祖先都是该子树的根节点，所以我们在回溯的时候，时常要更新整个子树的祖先，为了方便处理，我们使用并查集维护一个集合的祖先。总的时间复杂度是O(n+q)的，因为dfs是O(n)的，然后对于询问的处理大概就是O(q)的。
这就是离线的Tarjan算法，可能说起来比较难说清楚，但是写起来还是比较好写。下面贴上我在POJ 1470上过的题的代码，简单的LCA问题的求解。
[cpp] view plaincopy
/*
author UESTC_Nowitzki
*/

#include <iostream>
#include <cstring>
#include <cstdio>
#include <cstdlib>
#include <vector>
using namespace std;
const int MAX=1000;
int indegree[MAX];
int ancestor[MAX];
int set[MAX];
int vis[MAX];
int time[MAX];
vector<int> adj[MAX];
vector<int> que[MAX];

void init(int n)
{
    memset(time,0,sizeof(time));
    memset(vis,0,sizeof(vis));
    memset(indegree,0,sizeof(indegree));
    for(int i=1;i<=n;i++)
    {
        adj[i].clear();
        que[i].clear();
        set[i]=i;
        ancestor[i]=i;
    }
}

int find(int k)
{
    int r=k;
    while(set[r]!=r)
        r=set[r];
    int i=k,j;
    while(set[i]!=r)
    {
        j=set[i];
        set[i]=r;
        i=j;
    }
    return r;
}

void dfs(int i)
{
    int len=adj[i].size();
    for(int j=0;j<len;j++)
    {
        int son=adj[i][j];
        dfs(son);
        set[son]=i;
        ancestor[find(i)]=i;
    }
    vis[i]=1;
    len=que[i].size();
    for(int j=0;j<len;j++)
    {
        int son=que[i][j];
        if(vis[son])
        {
            int ans=ancestor[find(son)];
            time[ans]++;
        }
    }
}

int main()
{
    int n,i,t,a,b;
    while(scanf("%d",&n)!=EOF)
    {
        init(n);
        for(i=0;i<n;i++)
        {
            scanf("%d:(%d)",&a,&t);
            while(t--)
            {
                scanf("%d",&b);
                indegree[b]++;
                adj[a].push_back(b);
            }
        }
        scanf("%d",&t);
        while(t--)
        {
            while(getchar()!='(');
            scanf("%d%d",&a,&b);
            que[a].push_back(b);
            que[b].push_back(a);
        }
        while(getchar()!=')');
        for(i=1;i<=n;i++)
        {
            if(indegree[i]==0)
            {
  //              printf("root=%d\n",i);
                dfs(i);
                break;
            }
        }
        for(i=1;i<=n;i++)
        {
            if(time[i]>0)
                printf("%d:%d\n",i,time[i]);
        }
    }
    return 0;
}

Tarjan算法求解桥和边双连通分量（附POJ 3352 Road Construction解题报告）
分类：算法整理2011-07-21 11:03 1489人阅读评论(1) 收藏举报
construction算法
在说Tarjan算法解决桥和边双连通分量问题之前我们先来回顾一下Tarjan算法是如何求解强连通分量的。
Tarjan算法在求解强连通分量的时候，通过引入dfs过程中对一个点访问的顺序dfsNum（也就是在访问该点之前已经访问的点的个数）和一个点可以到达的最小的dfsNum的low数组，当我们遇到一个顶点的dfsNum值等于low值，那么该点就是一个强连通分量的根。因为我们在dfs的过程中已经将点仍入到栈中，因此我们只需要将栈中的元素出栈直到遇到根，那么这些点就组成一个强连通分量。
对于边双连通分量，我们需要先了解一些概念：
边连通度：使一个子图不连通所需要删除的最小的边数就是该图的边连通度。
桥（割边）：当删除一条边就使得图不连通的那条边称为桥或者是割边。
边双连通分量：边连通度大于等于二的子图称为边双连通分量。
理解了这些概念之后我们来看看Tarjan是如何求解边双连通分量的，不过在此之前我们先说说Tarjan是怎样求桥的。同样引入了dfsNum表示一个点在dfs过程中所被访问的时间，然后就是low数组表示该点最小的可以到达的dfsNum。我们分析一下桥的特点，删除一条边之后，那么如果dfs过程中的子树没有任何一个点可以到达父亲节点及父亲节点以上的节点，那么这个时候子树就被封死了，这条边就是桥。有了这个性质，也就是说当我们dfs过程中遇到一条树边a->b，并且此时low[b]>dfsNum[a]，那么a-b就是一座桥。
呵呵桥都求出来了，还怕边双连通分量吗？我们把所有的桥去掉之后那些独立的分量就是不同的边双连通分量，这个时候就可以按照需要灵活的求出边双连通分量了。
下面附上POJ 3352的解题思路吧：
这道题的意思是说，给你一个无向图，然后问你至少需要添加几条边，可以使整个图变成边双连通分量，也就是说任意两点至少有两条路可以互相连通。我们这样考虑这个问题，属于同一个边双连通分量的任意点是至少有两条通路是可以互相可达的，因此我们可以将一个边双连通分量缩成一个点。然后考虑不在边双连通分量中的点，通过缩点后形成的是一棵树，我们发现如果要将一棵树连成一个边双连通分量是需要（叶子节点数+1）/2的边数。这样问题就是变成缩点之后，求树的叶子节点的个数了。
这个题目的条件给的很强，表示任意两个点之间不会有重边，因此我们可以直接经过Tarjan的low值进行边双连通分量的划分，最后求出叶子节点数就可以解决问题了。如果是有重边的话，那么不同的low值是可能是属于同一个边双连通分量的，这个时候就要通过将图中的桥去掉然后求解边双连通分量，这个请见我的博客的另外一篇解题报告。
下面贴上POJ 3352的ac代码，供网友们参考：
[cpp] view plaincopy
#include <iostream>
#include <cstring>
#include <cstdlib>
#include <cstdio>
#include <vector>
using namespace std;
const int Max=1010;
int top[Max],edge[Max][Max];//memset(top,0,sizeof(top));
int dfsNum[Max],dfsnum;//memset(dfsNum,0,sizeof(dfsNum)),dfsNum=1;
int low[Max];
int degree[Max];
int ans;

void tarjan(int a,int fa)
{
    dfsNum[a]=low[a]=++dfsnum;
    for(int i=0;i<top[a];i++)
    {
        if(edge[a][i]!=fa)
        {
            if(dfsNum[edge[a][i]]==0)
            {
                tarjan(edge[a][i],a);
                if(low[a]>low[edge[a][i]])
                    low[a]=low[edge[a][i]];
            }
            else
            {
                if(low[a]>dfsNum[edge[a][i]])
                    low[a]=dfsNum[edge[a][i]];
            }
  //          if(low[edge[a][i]]>dfsNum[a])
  //          {

   //         }
        }
    }
}

int solve(int n)
{
    int i,j;
    int a,b;
    for(i=1;i<=n;i++)
    {
        a=i;
        for(j=0;j<top[i];j++)
        {
            b=edge[a][j];
            if(low[a]!=low[b])
            {
                degree[low[a]]++;
                degree[low[b]]++;
            }
        }
    }
    int leaves=0;
    for(i=1;i<=n;i++)
    {
        if(degree[i]==2)
        {
            leaves++;
        }
    }
    return (leaves+1)/2;
}

int main()
{
    int n,m;
    int i,a,b;
    while(scanf("%d %d",&n,&m)!=EOF)
    {
        memset(top,0,sizeof(top));
        memset(degree,0,sizeof(degree));
        for(i=0;i<m;i++)
        {
            scanf("%d %d",&a,&b);
            edge[a][top[a]++]=b;
            edge[b][top[b]++]=a;
        }

        memset(dfsNum,0,sizeof(dfsNum));
        dfsnum=0;

        tarjan(1,-1);
        ans=solve(n);
        printf("%d\n",ans);
    }
    return 0;
}

Tarjan

Tarjan求有向图的强连通分量（Tarjan算法描述）

（算法）Tarjan离线算法解决LCA问题 （附POJ 1470 Closest Common Ancestors 代码）

Tarjan算法求解桥和边双连通分量（附POJ 3352 Road Construction解题报告）

（算法）Tarjan离线算法解决LCA问题（附POJ 1470 Closest Common Ancestors 代码）