【模板】并查集(洛谷P3367)

题目背景

本题数据范围已经更新到 1≤N≤2×105,1≤M≤106。

题目描述

如题,现在有一个并查集,你需要完成合并和查询操作。

输入格式

第一行包含两个整数 N,M ,表示共有 N 个元素和 M 个操作。

接下来 M 行,每行包含三个整数 Zi​,Xi​,Yi​ 。

当 Zi​=1 时,将 Xi​ 与 Yi​ 所在的集合合并。

当 Zi​=2 时,输出 Xi​ 与 Yi​ 是否在同一集合内,是的输出 Y ;否则输出 N

输出格式

对于每一个 Zi​=2 的操作,都有一行输出,每行包含一个大写字母,为 Y 或者 N

输入输出样例

输入 #1复制运行

复制代码
4 7
2 1 2
1 1 2
2 1 2
1 3 4
2 1 4
1 2 3
2 1 4

输出 #1复制运行

复制代码
N
Y
N
Y

说明/提示

对于 15% 的数据,N≤10,M≤20。

对于 35% 的数据,N≤100,M≤103。

对于 50% 的数据,1≤N≤104,1≤M≤2×105。

对于 100% 的数据,1≤N≤2×105,1≤M≤106,1≤Xi​,Yi​≤N,Zi​∈{1,2}。


【算法模板】并查集 (Union-Find):路径压缩与集合合并

1. 核心概念

并查集是一种用于管理元素所属集合的数据结构,主要支持两种操作:

  1. 合并(Union):将两个不同的集合合并为一个集合。

  2. 查询(Find):查询某个元素属于哪个集合(即寻找该集合的"代表"或"老大")。

通俗理解

  • 数组 fa[i] :记录第 i 个人的"上级"是谁。

  • 初始化 :刚开始每个人都是自己的老大 (fa[i] = i)。

  • 查询 (find):想知道你是哪个帮派的?就一级一级往上找,直到找到那个"上级是自己"的人,他就是帮主。

  • 路径压缩:找帮主太累了?一旦找到帮主,直接把你的上级改成帮主。以后再问,一步就能找到。

  • 合并 (uni):两个帮派要合并?让 A 帮派的帮主,认 B 帮派的帮主做老大。


2. 完整代码

cpp 复制代码
#include <bits/stdc++.h>
using namespace std;
int n,m,z,x,y;
int fa[200010];//记录每个节点的父节点 即所在集合的老大

//找老大的过程中进行路径压缩
//即找到x的祖宗节点,并在过程中将x到祖宗路径上所有点的父节点直接设为祖宗
int find(int x){
    if(fa[x]==x) return x;//如果自己就是自己老大,返回自己
    //这一行完成了在查询过程中进行路径压缩 将最终的老大赋给到路径上每一个元素
    else return fa[x]=find(fa[x]);
}

void uni(int x,int y){
    int fax=find(x);
    int fay=find(y);
    //如果x和y老大不同 就要合并 让x的老大变成y的老大的老大
    if(fax!=fay) fa[fay]=fax;
}

int main(){
    ios::sync_with_stdio(false);
    cin.tie(0);
    //初始化所有元素的老大是自己
    cin>>n>>m;
    for(int i=1;i<=n;i++) fa[i]=i;
    while(m--){
        cin>>z>>x>>y;
        if(z==1){//合并
            uni(x,y);
        }
        else if(z==2){//查询
            //\n代替endl输出更快
            if(find(x)==find(y)) cout<<"Y"<<"\n";
            else cout<<"N"<<"\n";
        }
    }
}

3. 关键细节解析

A. 路径压缩

cpp 复制代码
return fa[x]=find(fa[x]);

这行代码是并查集效率极高的关键。如果不加这一步,树可能会退化成一条长链,查询复杂度变成 O(N)。加上路径压缩后,每次查询都会"压扁"树的高度,平均时间复杂度接近 O(1) (准确说是反阿克曼函数 O((N)))。

B. 初始化的时机

很多新手(包括以前的我)容易犯的错误:

复制代码
// ❌ 错误写法
for(int i=1; i<=n; i++) fa[i]=i; // 此时 n 还是 0!
cin >> n >> m;

// ✅ 正确写法
cin >> n >> m; // 先读入 n
for(int i=1; i<=n; i++) fa[i]=i; // 再根据 n 初始化

如果顺序反了,fa 数组全是 0,后续的 find 操作会陷入死循环或访问越界。

C. 输出优化

在算法竞赛中,当输出行数非常多(例如10^5行)时:

  • cout<<endl:会强制刷新缓冲区,速度慢。

  • cout << "\n":仅换行,速度快。

    建议习惯性使用 \n。


4. 应用场景

并查集不仅用于判断连通性,还是很多高级算法的基石:

  1. 图论判环:加边时,如果两个点已经在一个集合里,说明形成了环。

  2. Kruskal 算法:最小生成树的核心,利用并查集判断边是否连接了两个不同的连通块。

  3. 连通块数量统计 :最后遍历一遍 fa 数组,统计 fa[i]==i的个数。

相关推荐
iAkuya3 小时前
(leetcode)力扣100 62N皇后问题 (普通回溯(使用set存储),位运算回溯)
算法·leetcode·职场和发展
近津薪荼3 小时前
dfs专题5——(二叉搜索树中第 K 小的元素)
c++·学习·算法·深度优先
xiaoye-duck3 小时前
吃透 C++ STL list:从基础使用到特性对比,解锁链表容器高效用法
c++·算法·stl
松☆3 小时前
CANN与大模型推理:在边缘端高效运行7B参数语言模型的实践指南
人工智能·算法·语言模型
java干货3 小时前
为什么 “File 10“ 排在 “File 2“ 前面?解决文件名排序的终极算法:自然排序
开发语言·python·算法
皮皮哎哟3 小时前
数据结构:嵌入式常用排序与查找算法精讲
数据结构·算法·排序算法·二分查找·快速排序
程序员清洒4 小时前
CANN模型剪枝:从敏感度感知到硬件稀疏加速的全链路压缩实战
算法·机器学习·剪枝
vortex54 小时前
几种 dump hash 方式对比分析
算法·哈希算法
Wei&Yan5 小时前
数据结构——顺序表(静/动态代码实现)
数据结构·c++·算法·visual studio code
团子的二进制世界5 小时前
G1垃圾收集器是如何工作的?
java·jvm·算法