云智计划_数据结构_并查集

算法介绍

其实没什么好说的

注意几个点

1.fa[i]=i;

2.按秩合并(亦称启发式合并)与路径优化可以同时存在，只有一个复杂度为O(nlog n)，两个都用就是O(nα(n))，相当于O(n)

α()在1e6的数据下，也只有5，比常数还常数

代码

int find(int x){return(fa[x]==x?x:fa[x]=find(fa[x]));}

复制代码

void marge(int a,int b)
{
    x=find(x);y=find(y);
    if(a==b)return ;
    else fa[a]=b;//实在复杂度就是差一点，可以写个按秩排序
}

基础例题

1.P1111 修复公路 - 洛谷

其实就是板子

并查集特征：只关心谁与谁在同一集合

知识点：离线处理

然后就没辣
Talk is cheap,show me the code

复制代码

//https://www.luogu.com.cn/problem/P1111
//P1111 修复公路
#include<iostream>
#include<algorithm>
#define maxm 100010
#define maxn 1010
using namespace std;
struct EDGE
{
    int u,v,tim;
}edge[maxm];
int tot;
void add(int u,int v,int tim)
{
    edge[++tot].v=v;
    edge[tot].tim=tim;
    edge[tot].u=u;
}
bool rule(EDGE a,EDGE b)
{
    return a.tim<b.tim;
}
int fa[maxn];
int fd(int x){return(fa[x]==x?x:fa[x]=fd(fa[x]));}
int main()
{
    int n,m;
    cin>>n>>m;
    for(int i=1;i<=m;i++)
    {
        int x,y,z;
        cin>>x>>y>>z;
        add(x,y,z);
    }
    sort(edge+1,edge+tot+1,rule);
    for(int i=1;i<=n;i++)fa[i]=i;
    int ans=0;
    for(int i=1;i<=m;i++)
    {
        int u=edge[i].u,v=edge[i].v;
        if(fd(u)==fd(v))continue;
        ans=edge[i].tim;
        fa[fd(u)]=fd(v);
    }
    int root=fd(1);
    for(int i=2;i<=n;i++)if(fd(i)!=root)return cout<<-1,0;
    cout<<ans;
    return 0;
}

我这个做法没写按秩还是AC了

然后就是我这个无论如何都等到了m条边遍历完

如果是在循环中统计集合个数，==1直接return输出，循环出来-1会更快

2.P1955 [NOI2015] 程序自动分析 - 洛谷

这道题其实特别简单

最开始我以为只需要半离线

把≠先离线（其实就相当于讯问了）

然后＝具有传递性，直接放在同一集合

最后看看离线下来那些≠

在同一集合直接X

但是！！

1≤i,j≤1e9

看到这玩意直接吓哭孩子了

证据：#define maxi 1000000010

其实仔细一想，最多只会用到2n个数，其他的都没意义

（于是我开始尝试在不知道有"离散化"这个东西的情况下，手搓离散化）

（最开始想的是结构体存储对应关系，后来想到要1~tot循环查找2n次）

（时间复杂度直接飙升n^2，直接放弃了）

（看了题解才知道------啥玩意？有专门的算法？叫"离散化"？）

离散化

总得来说离散化有三步走战略：

1.去重（可以用到unique去重函数）排序

3.二分索引（可以用到lower_bound函数）

（摘自追梦_Chen）

见这篇博客

举例：

a：{1,100,10,10000,1000,100}------原数组

t：{1,100,10,10000,1000,100}------复制

t：{1,10,100,100,1000,10000}------排序

t：{1,10,100,1000,1000}------unique//若有不需去重的，有更好做法，还是见那篇博客

**去重后不相同元素的个数：**就是函数返回值减去集合的初始位置。

a 这里的删除不是真的delete，而是将重复的元素放到容器末尾
b 一定要先对数组进行排序才可以使用unique函数
c unique函数的返回值是去重之后的尾地址

（引自博客）

a：{1,3,2,5,4,5}------lower_bound

具体解释最后一行

a[1]:1//我喜欢从1开始

在t里找到1的下标------1

a[1]=1

a[2]:100

在t里找到100的下标------3

a[2]=3

以此类推

因为要离散化，所以必然先离线

剩下的就最开始说的就行了

进士侯人！！

fa数组和离散化数组这些同时涉及到等号左右两个数的这些数组

大小要开2*n！！！

因为n条（不）等式会最多有2*n个数
Talk is cheap , show me the code

复制代码

//https://www.luogu.com.cn/problem/P1955
//P1955 [NOI2015] ³ÌÐò×Ô¶¯·ÖÎö
#include<iostream>
#include<algorithm>
#include<cstring>
#define maxn 100010
using namespace std;
struct REQU
{
    int x,y,relation;
}a[maxn];
int cre[2*maxn];//一定别忘了开二倍！！！！因为每条指令两个数字
int tot,u[maxn],v[maxn];//赛博半离线
int fa[2*maxn];
int find(int x){return (fa[x]==x?x:fa[x]=find(fa[x]));}
void marge(int x,int y)
{
    x=find(x);y=find(y);
    if(x==y)return;
    fa[x]=y;
}
int main()
{
    int t;
    cin>>t;
    while(t--)
    {
        int n;
        tot=0;
        memset(a,0,sizeof(a));
        memset(cre,0,sizeof(cre));
        cin>>n;
        for(int i=1;i<=n;i++)cin>>a[i].x>>a[i].y>>a[i].relation;

        //*+*+*+*+*+*+*离散化Discretization*+*+*+*+*+*+*
        for(int i=1;i<=n;i++)cre[i]=a[i].x;
        for(int i=1;i<=n;i++)cre[i+n]=a[i].y;
        sort(cre+1,cre+n+n+1);
        int m=unique(cre+1,cre+n+n+1)-cre-1;
        //其实unique是有返回值的，返回值是去重之后的尾地址，减去头地址就是个数
        for(int i=1;i<=n;i++)a[i].x=lower_bound(cre+1,cre+m+1,a[i].x)-cre;//是m不是n+n
        for(int i=1;i<=n;i++)a[i].y=lower_bound(cre+1,cre+m+1,a[i].y)-cre;
        //lower:大于等于，upper:大于
        //我们这里是找等于
        //*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*

        for(int i=1;i<=m;i++)fa[i]=i;
        for(int i=1;i<=n;i++)
        {
            if(a[i].relation==0)
            {
                u[++tot]=a[i].x;
                v[tot]=a[i].y;
                continue;
            }
           marge(a[i].x,a[i].y);
        }
        bool yes=1;
        for(int i=1;i<=tot;i++)
            if(find(u[i])==find(v[i]))
                yes=0;
        if(yes==1)cout<<"YES\n";
        else cout<<"NO\n";
    }
    return 0;
}

然后补充一点：lower_bound那一行，要的就是把数字替换成下标，所以a[i].xy就是直接等于下标

3.P1197 [JSOI2008] 星球大战 - 洛谷

刚开始看这道题，我的第一反应是：

因为这个需要考虑连边方式了，所以感觉就不像是并查集能做出来的题啊

果然：老师：断边维护联通块数量是困难的

我：离线化处理，从最后删的边一条一条加（时光倒流）

被自己的想法吓了一跳

竟然对了！

我的思路：先离线，然后遍历所有删除的点标vis

然后建图，遇到vis=1时，把这条边先存在vis=1的点（可能两个都是）里

可以开一个vector

然后时光倒流，把当前点所有边所指向的联通块的根节点的父亲设置为这个边

最后，完全正确
Talk is cheap , show me the code.

复制代码

//https://www.luogu.com.cn/problem/P1197
//P1197 [JSOI2008] ÐÇÇò´óÕ½
#include<iostream>
#include<vector>
#define maxm 200010
#define maxn 400020
using namespace std;
int n,m,k;
int u[maxm],v[maxm];
bool vis[maxn];
int a[maxn];
int fa[maxn];
int ans[maxn];
vector <int> mp[maxn];
int find(int x){return (fa[x]==x?x:fa[x]=find(fa[x]));}
int main()
{
    cin>>n>>m;
    for(int i=1;i<=m;i++)cin>>u[i]>>v[i];
    cin>>k;
    for(int i=1;i<=k;i++)cin>>a[i];
    for(int i=1;i<=k;i++)vis[a[i]]=1;
    for(int i=0;i<n;i++)fa[i]=i;
    int block=n-k;
    for(int i=1;i<=m;i++)
    {
        int x=u[i],y=v[i];
        if(vis[x]==1)
        {
            mp[x].push_back(y);
        }
        if(vis[y]==1)
        {
            mp[y].push_back(x);
        }
        if(vis[x]==0&&vis[y]==0)
        {
            x=find(x);y=find(y);
            if(x!=y)
            {
                block--;
                fa[y]=x;
            }
        }
    }
    ans[k+1]=block;
    for(int i=k;i>=1;i--)
    {
        int p=a[i];
        vis[p]=0;
        block++;
        for(auto to:mp[p])
        {
            if(vis[to]==1)continue;
            if(find(to)!=find(p))
            {
                block--;
                fa[find(to)]=find(p);
            }
        }
        ans[i]=block;
    }
    for(int i=1;i<=k+1;i++)cout<<ans[i]<<"\n";
    return 0;
}

总结：正难则反

常见类型：时间倒流

带权并查集

额外支持操作：

1.给某个元素所在集合当前时刻所在这个集合的所有元素加一个值

2.查询某个元素的值

暴力/朴素操作：

每个点有一个值tag，代表当前点所在子树内，所有的点都要加上这个值

加一个值的时候，加到这个点所在集合代表元素（根）的tag上

查询一个值时，查询的是从根节点到该节点路径上所有tag和

进行集合合并时，把a指向b时，a要减去b的tag

因为b的tag本来只分给b所在子树

结果先a所在子树也在b所在子树内了

如果不做减法操作，那么b的tag就会分给a所在子树

但其实a所在子树并没有这个tag

有点抽象，举个例子

带权并查集详细图解

三个点123（红色代表实际值，方便观察与理解，黄色代表要记录的tag）

先将2+1，表现为代表元素（2）的tag+1

再将2和3合并（2指向3）

所以2的tag要减3的tag，1-0=1

然后再将2+2，表现为代表元素（3）的tag+2

此时，查询2的值，从2的tag一路加到树根3的tag

1+2=3

而查询3的值，就是3的tag本身，为2

再将1的值+1

1指向3

此时，1的tag要减去3的tag，1-2=-1

什么？竟然可以出现负数？我一直在加正权值啊

别急，tag并不是-1的值

此时，查询1的值，会发现是1与3的tag相加

-1+2=1

现在好懂多了吧

优化

按秩合并还是那个样，记录size，size小的的fa设置为大的那个

然后大的size+=小的size，这样优化完O(n logn)

但是我们亲爱敬爱的路径压缩就有问题了

因为我们的真实值是要计算一路到达根节点的所有tag的

你这样直接接到根节点上肯定不行

难道你那一路上的所有tag都不要了？

那么，路径压缩，路径压缩

压缩路径不就完事了

把从根节点

（根节点不计入内，因为你接入根节点后，还是要加根节点的tag）

到这个点的路径上的权值加起来

作为这个点新的tag

即新tag=真实值-根节点tag

（根节点tag其实就是根节点真实值）

复杂度也是O（n logn）

P1196 [NOI2002] 银河英雄传说 - 洛谷

这道题其实挺简单的

tag[a]=sz[b];
sz[b]+=sz[a];
fa[a]=b;

这可以算是这道题的状态转移方程吧......

推了有一段时间才推出来的

特点就是需要单独维护一个sz数组，其他的就是带权并查集模板
这是带权并查集的路径压缩

复制代码

嘻嘻

由于这道题，易证根节点tag恒为0

所以孩子节点路径压缩可以多次加根节点的值

压缩后的孩子节点tag-根节点tag=孩子节点tag-0=孩子节点tag=实际值（前面还有几个战舰）

因为在输出答案之前，肯定事先跑过一遍find，压缩完了

所以输出答案时可以不用算，直接用tag就行

其余的横看竖看也没看出来啥特别的

毕竟只是绿题

那就这样吧
Talk is cheap, show me the code

复制代码

//https://www.luogu.com.cn/problem/P1196
//P1196 [NOI2002] ÒøºÓÓ¢ÐÛ´<<Ëµ
#include<iostream>
#define maxn 30010
using namespace std;
int fa[maxn],sz[maxn],tag[maxn];
int find(int x)
{
    if(fa[x]==x)return x;//递归·终止条件
    int f=find(fa[x]);//先全部跑一遍，让每一个递归嵌套内的f=根节点
    tag[x]+=tag[fa[x]];//从根节点往下一层一层累加
    return fa[x]=f;//最后直接指向根节点
}
int main()
{
    for(int i=1;i<=30000;i++)fa[i]=i,sz[i]=1;
    int t;
    cin>>t;
    while(t--)
    {
        int a,b;
        char c;
        cin>>c>>a>>b;
        if(c=='M')
        {
            a=find(a);
            b=find(b);
            tag[a]=sz[b];
            sz[b]+=sz[a];
            fa[a]=b;
        }
        else
        {
            if(find(a)!=find(b))cout<<-1<<"\n";
            else
            {
                int x=tag[a],y=tag[b];
                if(x>y)swap(x,y);
                cout<<y-x-1<<"\n";
            }
        }
    }
    return 0;
}