


专栏:Java数据结构秘籍
个人主页:手握风云
目录
[1.1. 并查集的概念](#1.1. 并查集的概念)
[2.1. 查找元素属于哪个集合](#2.1. 查找元素属于哪个集合)
[2.2. 两个元素是否在同一个集合中](#2.2. 两个元素是否在同一个集合中)
[2.3. 两个集合归并成一个集合](#2.3. 两个集合归并成一个集合)
[2.4. 测试](#2.4. 测试)
[3.1. 省份数量](#3.1. 省份数量)
[3.2. 等式方程的可满足性](#3.2. 等式方程的可满足性)
一、并查集原理
1.1. 并查集的概念
并查集是一种用于管理分组的数据结构。它主要解决的问题是将 n 个不同的元素划分成一些不相交的集合。它的核心功能是在这些集合上进行两类操作:
-
合并 (Union): 将两个不同的集合合并为一个集合。
-
查询 (Find): 查询某一个元素属于哪个集合(通常通过查找该集合的"代表"或"根"来判断)。
比如,某公司在今年的校招中全国总共招生10人,其中西安招4人,成都招3人,武汉招3人。这10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体。现给这些学生进行编号,即 0 到 9,并给出一个数组用来存储该小集体,数组中的数字代表该小集体中具有成员的个数。

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路。于是,西安学生小分队 s1 ={0,6,7,8},成都学生小分队 s2 ={1,4,9},武汉学生小分队 s3={2,3,5} 就相互认识了,10个人最终形成了三个小团体。假设有三个群主0、1、2担任队长,负责大家的出行。经过一趟火车之旅后,每个小分队的成员就互相熟悉,称为了一个朋友圈。

在这个阶段,从树形结构和数组表示中可以看出:编号6、7、8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1);编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。

仔细观察数组中内容融化,可以得出以下结论:1. 数组的下标对应集合中元素的编号;2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数;3. 数组中如果为非负数,代表该元素双亲在数组中的下标。
在公司工作一段时间后,西安小分队中的8号同学与成都小分队的1号同学奇迹般地走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子。经过这次合并,现在0集合有7个人,2集合有3个人,总共合并成了两个朋友圈。

通过以上例子可知,并查集一般可以解决一下问题:1. 查找元素属于哪个集合,沿着数组表示树形关系以上一直找到根 (即:树中中元素为负数的位置);2. 查看两个元素是否属于同一个集合,沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在;3. 将两个集合归并成一个集合,将两个集合中的元素合并;4. 集合的个数。
二、并查集的实现
java
import java.util.Arrays;
public class UnionFindSet {
public int[] elem;
public UnionFindSet(int n) {
this.elem = new int[n];
Arrays.fill(elem, -1);
}
}
2.1. 查找元素属于哪个集合
如果 elem[x] >= 0:说明 elem[x] 是 x 的父节点索引,需要继续向上找根;如果 elem[x] < 0:说明 x 是一个集合的根节点。
java
/**
* 查找元素所在集合的根节点
* @param x 查找元素的索引
* @return 返回集合的根节点索引
*/
public int findRoot(int x) {
if (x < 0) {
throw new IndexOutOfBoundsException("下标越界异常");
}
while (elem[x] >= 0) {
x = elem[x];
}
return x;
}
2.2. 两个元素是否在同一个集合中
直接比较两个根节点的索引(或标识符)。如果相等,则判定为同一个集合。
java
/**
* 判断两个元素是否属于同一个并查集集合
* @param x1
* @param x2
* @return 属于一个集合返回 true,否则返回 false
*/
public boolean isSameUnionFindSet(int x1, int x2) {
int index1 = findRoot(x1);
int index2 = findRoot(x2);
return index1 == index2;
}
2.3. 两个集合归并成一个集合
要想实现合并,首先需要判断两个数是否在同一个集合中,如果不在才能进行合并。合并之后集合元素个数应为两个集合的元素个数之和。合并完之后,需要把原来的父亲节点的下标修改为新的索引。

java
/**
* 合并两个元素所在的集合
* @param x1 第一个元素
* @param x2 第二个元素
*/
public void union(int x1, int x2) {
// 找到两个元素的根节点
int index1 = findRoot(x1);
int index2 = findRoot(x2);
// 如果两个元素已经在同一个集合中,直接返回
if (index1 == index2) {
return;
}
// 将index2的父节点设置为index1,并将index1的元素数量增加
elem[index1] = elem[index1] + elem[index2];
elem[index2] = index1;
}
2.4. 测试
java
/**
* @return 获取集合个数
*/
public int getCount() {
int count = 0;
for (int i : elem) {
if (i < 0) {
count++;
}
}
return count;
}
public void print() {
for (int x : elem) {
System.out.print(x + " ");
}
System.out.println();
}
public static void main(String[] args) {
UnionFindSet unionFindSet = new UnionFindSet(10);
unionFindSet.union(0, 6);
unionFindSet.union(0, 7);
unionFindSet.union(0, 8);
unionFindSet.union(1, 4);
unionFindSet.union(1, 9);
unionFindSet.union(2, 3);
unionFindSet.union(2, 5);
unionFindSet.print();
System.out.println(unionFindSet.getCount());
System.out.println(unionFindSet.isSameUnionFindSet(6, 9));
System.out.println(unionFindSet.isSameUnionFindSet(6, 8));
}
三、并查集的应用
3.1. 省份数量

给定一个 n×n 的邻接矩阵 isConnected 表示城市之间的连接关系,其中 isConnected [i][j] = 1 代表第 i 个城市和第 j 个城市直接相连,为 0 则表示不直接相连。省份是由直接或间接相连的城市构成的连通集合,同一省份内的城市彼此连通,不同省份之间不连通。题目要求根据输入的邻接矩阵,计算并返回矩阵中省份的总数量。
算法原理:遍历二维数组,如果数组元素为1,就将两个城市进行合并,最后从并查集中获取集合个数就是省份数量。
java
class Solution {
public int findCircleNum(int[][] isConnected) {
int n = isConnected.length, m = isConnected[0].length;
UnionFindSet ufs = new UnionFindSet(n);
for (int i = 0; i < n; i++) {
for (int j = 0; j < m; j++) {
if (isConnected[i][j] == 1) {
ufs.union(i, j);
}
}
}
return ufs.getCount();
}
}
class UnionFindSet {
public int[] elem;
public UnionFindSet(int n) {
this.elem = new int[n];
Arrays.fill(elem, -1);
}
public int findRoot(int x) {
if (x < 0) {
throw new IndexOutOfBoundsException("下标越界异常");
}
while (elem[x] >= 0) {
x = elem[x];
}
return x;
}
public void union(int x1, int x2) {
// 找到两个元素的根节点
int index1 = findRoot(x1);
int index2 = findRoot(x2);
// 如果两个元素已经在同一个集合中,直接返回
if (index1 == index2) {
return;
}
// 将index2的父节点设置为index1,并将index1的元素数量增加
elem[index1] = elem[index1] + elem[index2];
elem[index2] = index1;
}
public int getCount() {
int count = 0;
for (int i : elem) {
if (i < 0) {
count++;
}
}
return count;
}
}
3.2. 等式方程的可满足性

给定一个由表示变量之间关系的字符串方程组成的数组,每个方程长度固定为 4,形式只有两种:"a==b" 或 "a!=b",其中 a 和 b 均为小写字母。题目要求判断是否存在一种整数分配方式,使得数组中所有方程都能同时被满足,若存在则返回true,不存在则返回 false。解题的核心在于处理变量间的相等与不等关系,先合并所有相等的变量,再验证所有不等关系是否与合并后的结果产生矛盾。
算法原理:遍历字符串数组,如果字符串中含有等号,则将两个小写字符合并。再次遍历数组,如果字符串中含有不等号,则查看两个字符是否存在于同一个集合中,如果存在,则说明两个字符同时存在等式和不等式,返回 false。
java
class Solution {
public boolean equationsPossible(String[] equations) {
UnionFindSet usf = new UnionFindSet(26);
for (String i : equations) {
if (i.charAt(1) == '=') {
usf.union(i.charAt(0) - 'a', i.charAt(3) - 'a');
}
}
for (String i : equations) {
if (i.charAt(1) == '!') {
int index1 = usf.findRoot(i.charAt(0) - 'a');
int index2 = usf.findRoot(i.charAt(3) - 'a');
if (index1 == index2) {
return false;
}
}
}
return true;
}
}
class UnionFindSet {
public int[] elem;
public UnionFindSet(int n) {
this.elem = new int[n];
Arrays.fill(elem, -1);
}
public int findRoot(int x) {
if (x < 0) {
throw new IndexOutOfBoundsException("下标越界异常");
}
while (elem[x] >= 0) {
x = elem[x];
}
return x;
}
public void union(int x1, int x2) {
int index1 = findRoot(x1);
int index2 = findRoot(x2);
if (index1 == index2) {
return;
}
elem[index1] = elem[index1] + elem[index2];
elem[index2] = index1;
}
}