Kruskal算法

来源:互联网 发布:国外数据库 编辑:程序博客网 时间:2024/06/07 01:36

Kruskal算法

  本文主要讲的是Kruskal算法,这是一种常用的用于寻找最小生成树的算法,由Joseph Kruskal于1956年发表。它是贪心的思想,易于编写,而且效率很高。
  何为“最小生成树”呢?在一给定的无向图G = (V, E)中,(u, v)代表连接顶点u与顶点v的边,而w(u, v)代表此边的权重。连接G中所有的点,且边集T为E的子集的树(无环图),称为G的生成树(Spanning Tree)。若一个生成树的总权值w(T)最小,则称此生成树为G的最小生成树(MST, Minimal Spanning Tree)。
  给出Kruskal算法的基本步骤思想如下:
  1) 将原图中的所有边依据权值按照从小到大的顺序排列。(直接使用库函数sort即可)
  2) 接下来按照权值从小到大考察每条边(u, v)。这时,若u和v已经处在同一个连通分量中,那么选择(u, v)后就会形成环,故显然不能选择;如果u和v还不在同一个连通分量中,那么就选择加入这条边。(贪心)因为当u和v不在同一连通分量中时,加入(u, v)一定是最优的。
  为什么这么说呢?下用反证法给出一个简单的证明。
  反设不加这条边能得到一个唯一最优解T,则T+(u, v)必有且仅有一个环。又因是从小到大考虑每条边的,故此环中至少存在一条边(u’, v’),其权值大于或等于(u, v)的权值。不妨在T上添加边(u, v),并删除边(u’, v’),即可得到一棵新树T’=T+(u, v)-(u’, v’)。这一T’的权值小于或等于原T的权值,与假设矛盾。故知加入(u, v)不会比不加入差。
  如果不理解数学证明过程,不要紧,记住上述结论即可。下为用Kruskal算法构造最小生成树的示意图。
Kruskal算法流程示意
  理解了上面的步骤,不难写出伪代码:

把原图中所有边按权值排序初始化MST为空,以及初始化连通分量for(int i = 0; i < m; i++)    if(e[i].u和e[i].v不在同一连通分量) {        把边e[i]加入MST        合并e[i].u和e[i].v所在的连通分量    }

  显而易见,该代码中最关键的地方在于“连通分量的查询与合并”。当然,暴力求解肯定是可行的,因为DFS和BFS都可以判断图的连通性。可惜,这个方法不但复杂,而且效率低。因此,我们在这里使用并查集(Union-Find Set)。
  并查集真的是一个极为精妙的方法,既简洁又高效。在本问题中,可以用集合来表示每个连通分量(各个连通的结点没有先后次序之分),而整个图的所有连通分量可以表示为一个“分划”(若干个交集为空,并集为全集的集合)。并查集的精妙之处在于用树来存储集合,用森林存储集族。例如,集族{ {1, 3, 4}, {2, 5} }需要用两棵树表示。这两棵树的具体形态是无关紧要的,只需一棵包含1, 3, 4三个点,一棵包含2, 5两个点即可。我们规定每棵树的根结点为这棵树所对应的集合的代表元。
  简单分析一下,如果把x的父结点存为p[x]中(若x为根结点则p[x]=x),很容易查找出x所在集合的代表元:

int find(int x) {    return p[x] == x ? x : find(p[x]);}

  现在,如果某棵树中有一条很长的链状结构,那么递归的时候便要沿着链遍历大量数据,非常低效。那么并查集是如何实现高效的呢?注意到,集合没有先后次序,意味着树的形状结构无关紧要。因此,我们在每次遍历时,都可以顺便把这些结点改为根结点的子结点,这就大大提高了之后遍历的效率。这一操作,称为并查集的路径压缩。实现的办法其实很简单,只需把递归返回的结果赋值给p[x]即可。更改后的代码如下:

int find(int x) {    return p[x] == x ? x : p[x] = find(p[x]);}

  至此,我们已经讲完了Kruskal算法的核心内容以及并查集的使用方法。由于这一算法(尤其是并查集)极为重要,建议各位自行编写程序。
  最后摆一道最小生成树的模板题:HDU1863,链接如下:
  http://acm.hdu.edu.cn/showproblem.php?pid=1863
  给出我写的Kruskal算法模板(也即HDU1863题解)如下:

#include<cstdio>#include<iostream>#include<algorithm>#include<cstring>#define maxn 102using namespace std;int n, m, p[maxn], sum, cnt;struct Edge {    int u, v, w;} e[maxn*maxn];void Init() {    memset(e, 0, sizeof(e));    memset(p, 0, sizeof(p));    sum = 0;    cnt = 0;}bool cmp(Edge e1, Edge e2) {    return e1.w < e2.w;}int find(int x) {    return p[x] == x ? x : p[x] = find(p[x]);}void union_set(int u, int v, int w) {    u = find(u);    v = find(v);    if(u == v) return;    p[u] = v;    sum += w;    cnt++;}int main() {    while(cin >> m >> n && m) {        Init();        for(int i = 0; i < m; i++) {            cin >> e[i].u >> e[i].v >> e[i].w;        }        sort(e, e+m, cmp);        for(int i = 1; i <= n; i++)            p[i] = i;        for(int i = 0; i < m; i++) {            union_set(e[i].u, e[i].v, e[i].w);        }        if(cnt != n-1) cout << "?\n";        else cout << sum << endl;    }    return 0;}