Kruskal算法

来源：互联网发布：国外数据库编辑：程序博客网时间：2024/06/07 01:36

Kruskal算法

　　本文主要讲的是Kruskal算法，这是一种常用的用于寻找最小生成树的算法，由Joseph Kruskal于1956年发表。它是贪心的思想，易于编写，而且效率很高。
　　何为“最小生成树”呢？在一给定的无向图G = (V, E)中，(u, v)代表连接顶点u与顶点v的边，而w(u, v)代表此边的权重。连接G中所有的点，且边集T为E的子集的树（无环图），称为G的生成树(Spanning Tree)。若一个生成树的总权值w(T)最小，则称此生成树为G的最小生成树(MST, Minimal Spanning Tree)。
　　给出Kruskal算法的基本步骤思想如下：
　　1) 将原图中的所有边依据权值按照从小到大的顺序排列。（直接使用库函数sort即可）
　　2) 接下来按照权值从小到大考察每条边(u, v)。这时，若u和v已经处在同一个连通分量中，那么选择(u, v)后就会形成环，故显然不能选择；如果u和v还不在同一个连通分量中，那么就选择加入这条边。（贪心）因为当u和v不在同一连通分量中时，加入(u, v)一定是最优的。
　　为什么这么说呢？下用反证法给出一个简单的证明。
　　反设不加这条边能得到一个唯一最优解T，则T+(u, v)必有且仅有一个环。又因是从小到大考虑每条边的，故此环中至少存在一条边(u’, v’)，其权值大于或等于(u, v)的权值。不妨在T上添加边(u, v)，并删除边(u’, v’)，即可得到一棵新树T’=T+(u, v)-(u’, v’)。这一T’的权值小于或等于原T的权值，与假设矛盾。故知加入(u, v)不会比不加入差。
　　如果不理解数学证明过程，不要紧，记住上述结论即可。下为用Kruskal算法构造最小生成树的示意图。
Kruskal算法流程示意
　　理解了上面的步骤，不难写出伪代码：

把原图中所有边按权值排序初始化MST为空，以及初始化连通分量for(int i = 0; i < m; i++)    if(e[i].u和e[i].v不在同一连通分量) {        把边e[i]加入MST        合并e[i].u和e[i].v所在的连通分量    }

　　显而易见，该代码中最关键的地方在于“连通分量的查询与合并”。当然，暴力求解肯定是可行的，因为DFS和BFS都可以判断图的连通性。可惜，这个方法不但复杂，而且效率低。因此，我们在这里使用并查集(Union-Find Set)。
　　并查集真的是一个极为精妙的方法，既简洁又高效。在本问题中，可以用集合来表示每个连通分量（各个连通的结点没有先后次序之分），而整个图的所有连通分量可以表示为一个“分划”（若干个交集为空，并集为全集的集合）。并查集的精妙之处在于用树来存储集合，用森林存储集族。例如，集族{ {1, 3, 4}, {2, 5} }需要用两棵树表示。这两棵树的具体形态是无关紧要的，只需一棵包含1, 3, 4三个点，一棵包含2, 5两个点即可。我们规定每棵树的根结点为这棵树所对应的集合的代表元。
　　简单分析一下，如果把x的父结点存为p[x]中（若x为根结点则p[x]=x），很容易查找出x所在集合的代表元：

int find(int x) {    return p[x] == x ? x : find(p[x]);}

　　现在，如果某棵树中有一条很长的链状结构，那么递归的时候便要沿着链遍历大量数据，非常低效。那么并查集是如何实现高效的呢？注意到，集合没有先后次序，意味着树的形状结构无关紧要。因此，我们在每次遍历时，都可以顺便把这些结点改为根结点的子结点，这就大大提高了之后遍历的效率。这一操作，称为并查集的路径压缩。实现的办法其实很简单，只需把递归返回的结果赋值给p[x]即可。更改后的代码如下：

int find(int x) {    return p[x] == x ? x : p[x] = find(p[x]);}

　　至此，我们已经讲完了Kruskal算法的核心内容以及并查集的使用方法。由于这一算法（尤其是并查集）极为重要，建议各位自行编写程序。
　　最后摆一道最小生成树的模板题：HDU1863，链接如下：
　　http://acm.hdu.edu.cn/showproblem.php?pid=1863
　　给出我写的Kruskal算法模板（也即HDU1863题解）如下：

#include<cstdio>#include<iostream>#include<algorithm>#include<cstring>#define maxn 102using namespace std;int n, m, p[maxn], sum, cnt;struct Edge {    int u, v, w;} e[maxn*maxn];void Init() {    memset(e, 0, sizeof(e));    memset(p, 0, sizeof(p));    sum = 0;    cnt = 0;}bool cmp(Edge e1, Edge e2) {    return e1.w < e2.w;}int find(int x) {    return p[x] == x ? x : p[x] = find(p[x]);}void union_set(int u, int v, int w) {    u = find(u);    v = find(v);    if(u == v) return;    p[u] = v;    sum += w;    cnt++;}int main() {    while(cin >> m >> n && m) {        Init();        for(int i = 0; i < m; i++) {            cin >> e[i].u >> e[i].v >> e[i].w;        }        sort(e, e+m, cmp);        for(int i = 1; i <= n; i++)            p[i] = i;        for(int i = 0; i < m; i++) {            union_set(e[i].u, e[i].v, e[i].w);        }        if(cnt != n-1) cout << "?\n";        else cout << sum << endl;    }    return 0;}

阅读全文

2 0