【算法与数据结构】不相交集合——并查集

来源:互联网 发布:cocos js 源码 编辑:程序博客网 时间:2024/04/29 18:31

来自coursera的课程:普林斯顿大学的算法。

通俗地讲,在一堆item上进行两种操作,一是合并,即将某两个item所在的集合合并为一个大集合;二是查询,即给定的两个item是否属于同一个集合。

高效快速地支持这种操作的数据结构就是并查集。


先看数学原理:

等价关系与等价类

从数学上看,等价类是一个对象(或成员)的集合,在此集合中的所有对象应满足等价关系。若用符号"≡"表示集合上的等价关系,那么对于该集合中的任意对象x,y, z,下列性质成立:

1、自反性:x ≡ x

2、对称性:若 x ≡ y 则 y ≡ x

3、传递性:若 x ≡ y 且 y ≡ z 则 x ≡ z

因此,等价关系是集合上的一个自反、对称、传递的关系。


常用实现:

常用的实现方法是采用森林结构,即相同集合的item同属于一个树。

使用树节点加权优化后,可以保证树的高度不超过logN(其中N为item数量);再加上路径压缩优化,平均复杂度可以在常数级别。

class UinonFind{public:    UinonFind(int N)    {        NUM = N;        id = new int[N];         sz = new int[N];         for (int i = 0; i < N; i ++)            id[i] = i, sz[i] = 1;    }    int root(int i)    {        while (i != id[i])        {                   id[i] = id[id[i]]; //优化1:路径压缩            i = id[i];        }               return i;    }    int connected(int p, int q)    {        return root(p) == root(q);    }    int connect(int p, int q)    {        int i = root(p);        int j = root(q);        //优化2: 加权树        if (sz[i] < sz[j]) {id[i] = j; sz[j] += sz[i];}         else               {id[j] = i; sz[i] += sz[j];}     }private:    int *id;    int *sz;    int NUM;};

例题:

给定N个整数{0,1,2,...,N-1}的集合,以及一些在该集合上的请求:

1) remove x 。 即将x从集合中删除

2) find x。即在集合中不小于x的最小整数,例如集合为{1, 2, 4,5},find 3,结果为4.


分析:

可以用并查集来解决这个问题。用并查集来维护相邻的被删除的集合,例如:{0, 1, 2, 3, 4}中删除掉{1,2},那么并查集数据结构中id[]可能是

id[] = {0, 1, 1, 3, 4}。我们只需要为每个id[i]=i的节点增加一个信息,来保存该子树中最大的值。

以5个整数的集合做个演示:

操作id[]max[]初始{-1,-1,-1,-1,-1}
{-1,-1,-1,-1,-1}
remove 1{-1,1,-1,-1,-1}
{-1,1,-1,-1,-1}
remove 4
{-1, 1, -1, -1, 4}
{-1, 1,-1,-1,4}
remove 2
{-1, 1,1,-1,4}
{-1,2,-1,-1,4}


当执行find x操作时,如果id[x]==-1,即结果为x;否则,另id[id[...id[x]...]]为x的根root,那么root+1即为结果,如果root==N,则无解。

原创粉丝点击