目录
介绍
并查集是一种用于 处理不相交集合的合并与查询问题的数据结构。它主要涉及以下基本概念和操作:
基本概念:
- 集合:并查集中的集合是由一组元素组成的,这些元素具有相同的属性或特征,集合之间相互不相交。
- 代表元素:每个集合都有一个代表元素,用于标识该集合。集合中的其他元素都可以通过一定的关系与代表元素相连。
基本操作: - 初始化:将每个元素都初始化为一个独立的集合,每个集合的代表元素就是该元素本身。
- 合并:将两个不同集合合并为一个集合。通常是将一个集合的代表元素连接到另一个集合的代表元素上,使得两个集合成为一个更大的集合。
- 查找:查找某个元素所在集合的代表元素。通过不断地沿着元素的父指针追溯,最终找到代表元素,从而确定该元素属于哪个集合。
并查集通常使用数组来实现,数组的下标表示元素,数组中存储的是该元素的父元素或代表元素的下标。在一些复杂的应用场景中,为了提高并查集的操作效率,还会采用路径压缩和按秩合并等优化策略。
并查集在 图论、数据分类、连通性问题等领域有广泛的应用。例如,在处理图的连通分量问题时,可以使用并查集来快速判断两个顶点是否属于同一个连通分量,以及合并不同的连通分量。
秩是什么
定义:秩可以看作是树的高度的一个估计值。在并查集的初始化阶段,每个元素都自成一个集合,此时集合的秩通常被初始化为 1,表示单个元素构成的树高度为 1。
作用: 在合并两个集合时,通过比较两个集合的秩来决定如何合并,以尽量保持树的平衡性,避免出现退化的树结构(即高度过高的树,会导致查找操作的时间复杂度增加)。
按秩合并策略:
- 当合并两个集合时,比较它们的秩。如果两个集合的秩不同,将秩较小的集合合并到秩较大的集合中。这样做的原因是,将较小的树连接到较大的树上,对整体树的高度影响较小,有助于保持树的平衡性。例如,一个秩为 2 的树和一个秩为 3 的树合并,会将秩为 2 的树连接到秩为 3 的树下面,合并后新树的秩不变,仍为 3。
- 如果两个集合的秩相同,那么可以任选一个集合作为合并的目标集合,并将另一个集合合并到该集合中。在这种情况下,合并后新集合的秩会增加 1。例如,两个秩都为 2 的树合并,合并后新树的秩变为 3。
通过使用秩和按秩合并策略,可以有效地降低并查集操作的时间复杂度,使得在大多数情况下,查找和合并操作都能在接近常数时间内完成。
例子------快速入门
假设有一群人,他们之间存在着不同的朋友关系。我们把每个人看作一个节点,朋友关系看作是连接节点的边,现在需要判断两个人是否在同一个朋友圈中,以及统计朋友圈的数量。
- 初始化:假设有 5 个人,分别用编号 0 - 4 表示。一开始,每个人都属于自己独立的朋友圈,即每个节点的父节点都是它自己。可以用一个数组parent来表示,parent[i]表示节点i的父节点,初始化为parent = [0, 1, 2, 3, 4]。
- 合并朋友圈:
- 已知 0 和 1 是朋友,通过union操作合并他们所在的集合。找到 0 和 1 的根节点,即 0 和 1 本身,将 1 的父节点设置为 0,此时parent = [0, 0, 2, 3, 4],表示 0 和 1 在同一个朋友圈中。
- 接着,2 和 3 是朋友,进行同样的合并操作,将 3 的父节点设置为 2,parent = [0, 0, 2, 2, 4]。
- 然后,1 和 3 是朋友,再次合并。先找到 1 的根节点是 0,3 的根节点是 2,将 2 的父节点设置为 0,parent = [0, 0, 0, 0, 4],此时 0、1、2、3 都在同一个朋友圈中。
- 查找:
- 要判断 4 和 3 是否在同一个朋友圈,通过find操作查找 4 的根节点是 4,3 的根节点是 0,根节点不同,所以 4 和 3 不在同一个朋友圈。
- 要判断 0 和 2 是否在同一个朋友圈,查找 0 和 2 的根节点都是 0,根节点相同,所以 0 和 2 在同一个朋友圈。
- 统计朋友圈数量:最后,通过遍历parent数组,统计根节点的数量,即不同的代表元素的数量,就可以得到朋友圈的数量。在这个例子中,有两个不同的根节点 0 和 4,所以朋友圈数量为 2。
Go
package main
import "fmt"
// UnionFind 定义并查集结构体
type UnionFind struct {
parent []int // parent 切片用于存储每个元素的父节点,初始时每个元素的父节点是其自身
// 在合并两个集合时,通过比较两个集合的秩来决定如何合并,以尽量保持树的平衡性,避免出现退化的树结构(即高度过高的树,会导致查找操作的时间复杂度增加)。
rank []int // rank 切片用于记录每个集合的秩(通常是树的高度)
count int // 朋友圈的数量
}
// NewUnionFind 初始化并查集
func NewUnionFind(n int) *UnionFind {
parent := make([]int, n)
rank := make([]int, n)
for i := range parent {
parent[i] = i
rank[i] = 1
}
return &UnionFind{
parent: parent,
rank: rank,
count: n,
}
}
// Find 查找元素所在集合的代表元素
func (uf *UnionFind) Find(x int) int {
// 如果元素x的父节点(parent[x])不是它自己,就递归的查找它(parent[x]元素)的父节点
if uf.parent[x] != x {
uf.parent[x] = uf.Find(uf.parent[x])
}
return uf.parent[x]
}
// Union 合并两个元素所在的集合
func (uf *UnionFind) Union(x, y int) {
rootX := uf.Find(x)
rootY := uf.Find(y)
if rootX == rootY {
return
}
if uf.rank[rootX] < uf.rank[rootY] {
rootX, rootY = rootY, rootX
}
uf.parent[rootY] = rootX // 更改 rootY 的父节点为 rootX
uf.rank[rootX] += uf.rank[rootY] // 更改 rootX 的秩
uf.count-- // 朋友圈数量--
}
// GetCount 获取连通分量的数量
func (uf *UnionFind) GetCount() int {
return uf.count
}
func main() {
// 假设有 5 个人
n := 5
uf := NewUnionFind(n)
// 合并操作,模拟朋友关系
uf.Union(0, 1)
uf.Union(2, 3)
uf.Union(1, 3)
// 判断 4 和 3 是否在同一个朋友圈
sameCircle1 := uf.Find(4) == uf.Find(3)
fmt.Printf("4 和 3 是否在同一个朋友圈: %v\n", sameCircle1)
// 判断 0 和 2 是否在同一个朋友圈
sameCircle2 := uf.Find(0) == uf.Find(2)
fmt.Printf("0 和 2 是否在同一个朋友圈: %v\n", sameCircle2)
// 统计朋友圈的数量
circleCount := uf.GetCount()
fmt.Printf("朋友圈的数量: %d\n", circleCount)
// 4 和 3 是否在同一个朋友圈: false
// 0 和 2 是否在同一个朋友圈: true
// 朋友圈的数量: 2
}
例题
在并查集的实现中,rank 数组(或类似用于记录秩的机制)并不是必需的,有些题目里的并查集没有使用 rank 数组主要有以下原因:
简化实现:对于一些简单的问题场景,不需要通过按秩合并来优化并查集的性能,仅使用路径压缩就可以满足时间复杂度要求。此时可以省略 rank 数组,代码实现会更简洁。比如在一些数据规模较小或者对时间复杂度要求不高的问题中,单纯的路径压缩就能让并查集的操作效率足够高。
采用其他优化方式:有些并查集的实现可能不使用 rank 数组来记录秩,而是采用其他方式来优化合并操作。例如,记录每个集合的大小,在合并时将较小的集合合并到较大的集合中,这种方法也能在一定程度上避免树结构的退化,提高查找和合并的效率。
使用路径压缩,不使用秩合并
Go
// 使用路径压缩,不使用秩合并
package main
type UnionFind struct {
parent []int
}
func NewUnionFind(n int) *UnionFind {
parent := make([]int, n)
for i := range parent {
parent[i] = i
}
return &UnionFind{
parent: parent,
}
}
// Find 查找
func (uf *UnionFind) Find(x int) int {
if uf.parent[x] != x {
uf.parent[x] = uf.Find(uf.parent[x])
}
return uf.parent[x]
}
// Union 合并
func (uf *UnionFind) Union(x, y int) {
rootX := uf.Find(x)
rootY := uf.Find(y)
uf.parent[rootY] = rootX
}
// IsConnected 判断两个元素是否在同一个集合中
func (uf *UnionFind) IsConnected(x, y int) bool {
return uf.Find(x) == uf.Find(y)
}
相应的例题:
力扣:547. 省份数量(并查集,也可以用dfs、bfs)
力扣:684. 冗余连接(并查集)
使用路径压缩和秩合并
Go
// 使用路径压缩和秩合并(优化并查集的性能)
package main
// UnionFind 定义并查集结构体
type UnionFind struct {
parent []int
rank []int
}
// NewUnionFind 初始化并查集
func NewUnionFind(n int) *UnionFind {
parent := make([]int, n)
rank := make([]int, n)
for i := range parent {
parent[i] = i
rank[i] = 1
}
return &UnionFind{
parent: parent,
rank: rank,
}
}
// Find 查找元素所在集合的代表元素,使用路径压缩
func (uf *UnionFind) Find(x int) int {
if uf.parent[x] != x {
uf.parent[x] = uf.Find(uf.parent[x])
}
return uf.parent[x]
}
// Union 合并两个元素所在的集合,使用按秩合并
func (uf *UnionFind) Union(x, y int) {
rootX := uf.Find(x)
rootY := uf.Find(y)
if rootX == rootY {
return
}
if uf.rank[rootX] < uf.rank[rootY] {
rootX, rootY = rootY, rootX
}
uf.parent[rootY] = rootX
uf.rank[rootX] += uf.rank[rootY]
}
// IsConnected 判断两个元素是否在同一个集合中
func (uf *UnionFind) IsConnected(x, y int) bool {
return uf.Find(x) == uf.Find(y)
}
相应的例题:
力扣:1584. 连接所有点的最小费用(Kruskal算法、最小生成树、并查集)
无向图和有向图
并查集在无向图中的应用更为直接和常见。(当然,在一些有向图的问题中也能通过适当的转化和处理来发挥作用)
相应的例题:
力扣:2101. 引爆最多的炸弹(有向图)
问:这道题为什么不能用并查集?
答:注意本题是有向图。例如炸弹 0 可以引爆炸弹 2,炸弹 1 可以引爆炸弹 2,对应有向边 0→2,1→2,那么正确答案是 2。如果用并查集做的话,会把 0,1,2 三个点合并起来,计算出错误的答案 3。