【算法笔记】并查集详解

🚀 并查集(Union-Find)详解:原理、实现与优化

并查集(Union-Find)是一种非常高效的数据结构,用于处理动态连通性问题,即判断若干个元素是否属于同一个集合,并支持集合合并操作。它在图算法中(如 Kruskal 最小生成树)、朋友圈统计、网络连通性判断等场景中非常常见。

🧠 并查集的核心功能

  • find(x) :查找元素 x 所在集合的代表(也叫"根节点")
  • union(x, y) :将元素 xy 所在的两个集合合并
  • parent[x]:记录每个元素的"父亲",通过父亲链条找祖先(树结构)

🧩 并查集基本结构

python 复制代码
n = 5
parents = list(range(n + 1))  # parents[i] = i,0号位不使用

🔍 基本实现:find 和 union

python 复制代码
def find(x):
    if parents[x] == x:
        return x
    else:
        return find(parents[x])
python 复制代码
def union(x, y):
    root_x = find(x)
    root_y = find(y)
    if root_x == root_y:
        return False
    parents[root_y] = root_x
    return True

🧠 类比记忆

  • 每个元素的 parent 就像是它的"爸爸"
  • find(x) 就是往上找老祖宗
  • union(x, y) 就是两个家族联姻,把一个家族并进另一个

⚡ 并查集优化技巧(路径优化):路径压缩优化

查询时顺便把路径上所有的节点都指向大族长,一次find后这条路径的深度为1

python 复制代码
def find(x):
    if x != parents[x]:
        parents[x] = find(parents[x])
    return parents[x]

🧱 并查集优化技巧(合并优化):按秩合并 & 按大小合并

🔢 按大小合并(Union by Size)

小家族归大家族,大的当族长

python 复制代码
size = [1] * (n + 1)

def union(x, y):
    rx, ry = find(x), find(y)
    if rx == ry:
        return False
    if size[rx] < size[ry]:
        parents[rx] = ry
        size[ry] += size[rx]
    else:
        parents[ry] = rx
        size[rx] += size[ry]
    return True

🏷️ 按秩合并(Union by Rank)

辈分高的当族长

python 复制代码
rank = [0] * (n + 1)

def union(x, y):
    rx, ry = find(x), find(y)
    if rx == ry:
        return False
    if rank[rx] < rank[ry]:
        parents[rx] = ry
    elif rank[rx] > rank[ry]:
        parents[ry] = rx
    else:
        parents[ry] = rx
        rank[rx] += 1
    return True

💡 组合使用建议

最推荐的并查集配置是:

路径压缩 + 按秩合并 或 按大小合并

能达到几乎 O(1) 的查询和合并效率。

📚 应用场景

  • Kruskal 最小生成树算法
  • 网络连通性判断
  • 动态连通块个数统计
  • 岛屿数量(LeetCode 200)
  • 冗余连接(LeetCode 684)
  • 朋友圈数量(LeetCode 547)

🎯 总结

术语 含义
find(x) 找出 x 所属集合的根节点
union(x, y) 合并 x 和 y 的集合(若不属于同一集合)
路径压缩 加快 find 查询效率
按秩/按大小 优化合并策略,防止退化
树的结构 集合之间的连接关系

并查集看起来简单,背后其实是极高效的数据结构设计。建议掌握它,并尝试应用到图论、集合问题中去!


🧩 常见练习题

✅ 基础入门题

题号 题目名称 链接 简介
200 岛屿数量 LeetCode 200 判断二维网格中有多少个连通块
684 冗余连接 LeetCode 684 找出图中导致环的边
1319 连通网络的操作次数 LeetCode 1319 判断有多少连通块,以及最少连接次数

🧠 中级应用题

题号 题目名称 链接 简介
1202 交换字符串中的元素 LeetCode 1202 使用并查集形成交换组,对组内排序
721 账户合并 LeetCode 721 通过邮箱合并属于同一用户的账户
323 无向图中连通分量的数目 LeetCode 323 通用连通块计数问题

🔍 进阶与变种题

题号 题目名称 链接 简介
399 除法求值 LeetCode 399 带权并查集:维护节点之间的比例关系
547 省份数量(等价朋友圈问题) LeetCode 547 判断有多少朋友圈/省份
990 等式方程的可满足性 LeetCode 990 并查集维护等式约束

📌 推荐练习顺序

  1. 200 - 岛屿数量
  2. 684 - 冗余连接
  3. 1319 - 连通网络的操作次数
  4. 547 - 省份数量
  5. 1202 - 字符串交换
  6. 721 - 邮箱合并
  7. 399 - 除法求值
  8. 990 - 等式方程可解性

🧠 建议掌握:

  • 基础并查集结构(find, union
  • 路径压缩优化
  • 带权并查集(维护差值、比例等信息)
  • 一维映射(如坐标 → 编号)
相关推荐
漫随流水22 分钟前
leetcode算法(111.二叉树的最小深度)
数据结构·算法·leetcode·二叉树
叫我:松哥1 小时前
基于大数据和深度学习的智能空气质量监测与预测平台,采用Spark数据预处理,利用TensorFlow构建LSTM深度学习模型
大数据·python·深度学习·机器学习·spark·flask·lstm
吃茄子的猫8 小时前
quecpython中&的具体含义和使用场景
开发语言·python
孙严Pay8 小时前
快捷支付:高效安全的在线支付新选择
笔记·科技·计算机网络·其他·微信
じ☆冷颜〃8 小时前
黎曼几何驱动的算法与系统设计:理论、实践与跨领域应用
笔记·python·深度学习·网络协议·算法·机器学习
数据大魔方8 小时前
【期货量化实战】日内动量策略:顺势而为的短线交易法(Python源码)
开发语言·数据库·python·mysql·算法·github·程序员创富
POLITE38 小时前
Leetcode 23. 合并 K 个升序链表 (Day 12)
算法·leetcode·链表
APIshop8 小时前
Python 爬虫获取 item_get_web —— 淘宝商品 SKU、详情图、券后价全流程解析
前端·爬虫·python
楚来客8 小时前
AI基础概念之八:Transformer算法通俗解析
人工智能·算法·transformer
风送雨8 小时前
FastMCP 2.0 服务端开发教学文档(下)
服务器·前端·网络·人工智能·python·ai