并查集

来源:互联网 发布:手机版希沃白板软件 编辑:程序博客网 时间:2024/06/11 02:01


Problem Description 
某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路? 
Input 
测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。 
注意:两个城市之间可以有多条道路相通,也就是说 
3 3 
1 2 
1 2 
2 1 
这种输入也是合法的 
当N为0时,输入结束,该用例不被处理。 
Output 
对每个测试用例,在1行里输出最少还需要建设的道路数目。 
Sample Input 
4 2 
1 3 
4 3 
3 3 
1 2 
1 3 
2 3 
5 2 
1 2 
3 5 
999 0 

Sample Output 



998 
Hint

Huge input, scanf is recommended.

畅通工程是并查集里面,非常基础且典型的一道题。

相互连接的城市构成一个集合,只需要判断集合个数即可知道要修多少条路。

集合个数的判断也可以根据每个集合只有一个根节点的特征,找n个数里有几个根节点,并减去1。

为什么减去1?  3个孤独的城镇互联,只需要两条路,同理三个集合之间关联也只需要两条路,所以是集合总数减1。

再说一下并查集,并查集的概念用数来理解较好,但是实现是用数组来实现的。


就用上面这个图来简单说一下吧。

令a,b,c,d组成一个集合,e,f,g组成另一个集合。

谈到树的概念,树的维护用father数组,就是父节点,每一个树叶都有各自的父节点,最终会查询到这棵树的根节点,根节点是唯一的。例如:d的父节点是b,b的父节点是a,a是这棵树的根节点。

如何判断d和c有联系呢?

通过向上查找根节点,查看这两个点的根节点是否相同,即可知道它们两者是否有联系。

d的根节点是a,c的父节点是a,同样a也是父节点→可以发现d和c的根节点相同,所以可以判断他们之间属于一个集合,即有联系。

并查集,显然就是将集合合并起来。

合并的意义就是让两个集合之间都可以相关联,判断关联与否在于父节点是否相同。

因此,合并就是将一个树为主树(一般以节点个数多的为主),一个树扩展成主树的一条枝。

修改只需要修改从树根节点的father值,将从树根节点的父节点设置为主树根节点。

这样两个树就合并成一个树了。

同右面的图,判断d和g是否相关联:

d的根节点为a,g的父节点为f,f父节点e,e父节点为a,因为两者根节点相同,所以这两者是相关联的。

这些都是我的理解,若有不对的地方,欢迎提出。

下面是这道题的代码,这道题提示中说数据量很大,最好用scanf,用cin其实也可以过,不过时间多了15MS

#include <stdio.h>const int MAX=1000;int father[MAX];//初始化函数void Init(int n){    int i;  for(i=1;i<=n;i++)    father[i]=i;}//查找函数int Find(int x){  while(father[x]!=x)    x=father[x];  return x;}//合并函数void combine(int a,int b){    int temp_a,temp_b;  temp_a=Find(a);  temp_b=Find(b);  if(temp_a!=temp_b)    father[temp_a]=temp_b;}//确定连通分量个数int find_ans(int n){    int i,sum=0;    for(i=1;i<=n;++i)        if(father[i]==i)            ++sum;    return sum;}int main(){  int i,n,m,a,b;  while(scanf("%d",&n)!=EOF)  {      if(!n)  break;    Init(n);    scanf("%d",&m);    for(i=0;i<m;++i)    {      scanf("%d%d",&a,&b);      combine(a,b);    }    printf("%d\n",find_ans(n)-1);  }  return 0;}

1. 简述

    并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。
    需要实现的操作有:合并两个集合,判断两个元素是否属于一个集合。
    这里介绍的主要是普通的并查集,很多情况下使用的并查集是需要扩展的,根据使用情况的不同,有很多差别,这里仅仅是最基本的算法。

2. 复杂度

    T=O(n*α(n)) , 其中α(x),对于x=宇宙中原子数之和,α(x)不大于4。事实上,路经压缩后的并查集的复杂度是一个很小的常数。
3. 伪代码   

    没有使用路径压缩和启发式的方法。

复制代码
// 初始化并查集
#define N 100
int father[N];
void init() {
    for(int i=0; i<N; i++)
      father[i] = i;
}
// 合并两个元素所在的集合
void union(int x,int y) {
    x 
= getfather(x);
    y 
= getfather(y);
    
if(x!= y)
       father[x]
=y;
}
// 判断两个元素是否属于同一个集合
bool same(int x,int y) {
    
return getfather(x)==getfather(y);
}
// 获取根结点
int getfather(int x) {
    
while(x != father[x])
      x 
= father[x];
    
return x;
}
复制代码

    使用路径压缩,改进getfather。

// 获取根结点
int getfather(int x) {
    
if(x != father[x])
      father[x] 
= getfather(father[x]); // 路径压缩修改的是father数组
    return father[x];
}

    另外,还可以改进union,把数量少的集合合并到数量大的集合中,不过这就要记录每个集合中的元素数量,相当于增加了O(N)的存储空间,而且在getfather中也应该保持对元素数量的维护,相对代码复杂度偏高,而且感觉性能提升不多,这里就不写了。

0 0