Java 数据结构第二十九期:并查集,关系宇宙的压缩算法

专栏:Java数据结构秘籍

个人主页:手握风云

目录

一、并查集原理

[1.1. 并查集的概念](#1.1. 并查集的概念)

二、并查集的实现

[2.1. 查找元素属于哪个集合](#2.1. 查找元素属于哪个集合)

[2.2. 两个元素是否在同一个集合中](#2.2. 两个元素是否在同一个集合中)

[2.3. 两个集合归并成一个集合](#2.3. 两个集合归并成一个集合)

[2.4. 测试](#2.4. 测试)

三、并查集的应用

[3.1. 省份数量](#3.1. 省份数量)

[3.2. 等式方程的可满足性](#3.2. 等式方程的可满足性)


一、并查集原理

1.1. 并查集的概念

并查集是一种用于管理分组的数据结构。它主要解决的问题是将 n 个不同的元素划分成一些不相交的集合。它的核心功能是在这些集合上进行两类操作:

  • 合并 (Union): 将两个不同的集合合并为一个集合。

  • 查询 (Find): 查询某一个元素属于哪个集合(通常通过查找该集合的"代表"或"根"来判断)。

比如,某公司在今年的校招中全国总共招生10人,其中西安招4人,成都招3人,武汉招3人。这10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体。现给这些学生进行编号,即 0 到 9,并给出一个数组用来存储该小集体,数组中的数字代表该小集体中具有成员的个数。

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路。于是,西安学生小分队 s1 ={0,6,7,8},成都学生小分队 s2 ={1,4,9},武汉学生小分队 s3={2,3,5} 就相互认识了,10个人最终形成了三个小团体。假设有三个群主0、1、2担任队长,负责大家的出行。经过一趟火车之旅后,每个小分队的成员就互相熟悉,称为了一个朋友圈。

在这个阶段,从树形结构和数组表示中可以看出:编号6、7、8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1);编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。

仔细观察数组中内容融化,可以得出以下结论:1. 数组的下标对应集合中元素的编号;2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数;3. 数组中如果为非负数,代表该元素双亲在数组中的下标。

在公司工作一段时间后,西安小分队中的8号同学与成都小分队的1号同学奇迹般地走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子。经过这次合并,现在0集合有7个人,2集合有3个人,总共合并成了两个朋友圈。

通过以上例子可知,并查集一般可以解决一下问题:1. 查找元素属于哪个集合,沿着数组表示树形关系以上一直找到根 (即:树中中元素为负数的位置);2. 查看两个元素是否属于同一个集合,沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在;3. 将两个集合归并成一个集合,将两个集合中的元素合并;4. 集合的个数。

二、并查集的实现

java 复制代码
import java.util.Arrays;

public class UnionFindSet {
    public int[] elem;

    public UnionFindSet(int n) {
        this.elem = new int[n];
        Arrays.fill(elem, -1);
    }
}

2.1. 查找元素属于哪个集合

如果 elem[x] >= 0:说明 elem[x] 是 x 的父节点索引,需要继续向上找根;如果 elem[x] < 0:说明 x 是一个集合的根节点。

java 复制代码
/**
 * 查找元素所在集合的根节点
 * @param x 查找元素的索引
 * @return 返回集合的根节点索引
 */
public int findRoot(int x) {
    if (x < 0) {
        throw new IndexOutOfBoundsException("下标越界异常");
    }
    while (elem[x] >= 0) {
        x = elem[x];
    }

    return x;
}

2.2. 两个元素是否在同一个集合中

直接比较两个根节点的索引(或标识符)。如果相等,则判定为同一个集合。

java 复制代码
/**
 * 判断两个元素是否属于同一个并查集集合
 * @param x1
 * @param x2
 * @return 属于一个集合返回 true,否则返回 false
 */
public boolean isSameUnionFindSet(int x1, int x2) {
    int index1 = findRoot(x1);
    int index2 = findRoot(x2);

    return index1 == index2;
}

2.3. 两个集合归并成一个集合

要想实现合并,首先需要判断两个数是否在同一个集合中,如果不在才能进行合并。合并之后集合元素个数应为两个集合的元素个数之和。合并完之后,需要把原来的父亲节点的下标修改为新的索引。

java 复制代码
/**
 * 合并两个元素所在的集合
 * @param x1 第一个元素
 * @param x2 第二个元素
 */
public void union(int x1, int x2) {
    // 找到两个元素的根节点
    int index1 = findRoot(x1);
    int index2 = findRoot(x2);

    // 如果两个元素已经在同一个集合中,直接返回
    if (index1 == index2) {
        return;
    }
    // 将index2的父节点设置为index1,并将index1的元素数量增加
    elem[index1] = elem[index1] + elem[index2];
    elem[index2] = index1;
}

2.4. 测试

java 复制代码
/**
 * @return 获取集合个数
 */
public int getCount() {
    int count = 0;
    for (int i : elem) {
        if (i < 0) {
            count++;
        }
    }
    return count;
}

public void print() {
    for (int x : elem) {
        System.out.print(x + " ");
    }
    System.out.println();
}

public static void main(String[] args) {
    UnionFindSet unionFindSet = new UnionFindSet(10);

    unionFindSet.union(0, 6);
    unionFindSet.union(0, 7);
    unionFindSet.union(0, 8);

    unionFindSet.union(1, 4);
    unionFindSet.union(1, 9);

    unionFindSet.union(2, 3);
    unionFindSet.union(2, 5);

    unionFindSet.print();

    System.out.println(unionFindSet.getCount());

    System.out.println(unionFindSet.isSameUnionFindSet(6, 9));
    System.out.println(unionFindSet.isSameUnionFindSet(6, 8));
}

三、并查集的应用

3.1. 省份数量

给定一个 n×n 的邻接矩阵 isConnected 表示城市之间的连接关系,其中 isConnected [i][j] = 1 代表第 i 个城市和第 j 个城市直接相连,为 0 则表示不直接相连。省份是由直接或间接相连的城市构成的连通集合,同一省份内的城市彼此连通,不同省份之间不连通。题目要求根据输入的邻接矩阵,计算并返回矩阵中省份的总数量。

算法原理:遍历二维数组,如果数组元素为1,就将两个城市进行合并,最后从并查集中获取集合个数就是省份数量。

java 复制代码
class Solution {
    public int findCircleNum(int[][] isConnected) {
        int n = isConnected.length, m = isConnected[0].length;
        UnionFindSet ufs = new UnionFindSet(n);

        for (int i = 0; i < n; i++) {
            for (int j = 0; j < m; j++) {
                if (isConnected[i][j] == 1) {
                    ufs.union(i, j);
                }
            }
        }

        return ufs.getCount();
    }
}

class UnionFindSet {
    public int[] elem;

    public UnionFindSet(int n) {
        this.elem = new int[n];
        Arrays.fill(elem, -1);
    }

    public int findRoot(int x) {
        if (x < 0) {
            throw new IndexOutOfBoundsException("下标越界异常");
        }
        while (elem[x] >= 0) {
            x = elem[x];
        }

        return x;
    }

    public void union(int x1, int x2) {
        // 找到两个元素的根节点
        int index1 = findRoot(x1);
        int index2 = findRoot(x2);

        // 如果两个元素已经在同一个集合中,直接返回
        if (index1 == index2) {
            return;
        }
        // 将index2的父节点设置为index1,并将index1的元素数量增加
        elem[index1] = elem[index1] + elem[index2];
        elem[index2] = index1;
    }

    public int getCount() {
        int count = 0;
        for (int i : elem) {
            if (i < 0) {
                count++;
            }
        }
        return count;
    }
}

3.2. 等式方程的可满足性

给定一个由表示变量之间关系的字符串方程组成的数组,每个方程长度固定为 4,形式只有两种:"a==b" 或 "a!=b",其中 a 和 b 均为小写字母。题目要求判断是否存在一种整数分配方式,使得数组中所有方程都能同时被满足,若存在则返回true,不存在则返回 false。解题的核心在于处理变量间的相等与不等关系,先合并所有相等的变量,再验证所有不等关系是否与合并后的结果产生矛盾。

算法原理:遍历字符串数组,如果字符串中含有等号,则将两个小写字符合并。再次遍历数组,如果字符串中含有不等号,则查看两个字符是否存在于同一个集合中,如果存在,则说明两个字符同时存在等式和不等式,返回 false。

java 复制代码
class Solution {
    public boolean equationsPossible(String[] equations) {
        UnionFindSet usf = new UnionFindSet(26);

        for (String i : equations) {
            if (i.charAt(1) == '=') {
                usf.union(i.charAt(0) - 'a', i.charAt(3) - 'a');
            }
        }

        for (String i : equations) {
            if (i.charAt(1) == '!') {
                int index1 = usf.findRoot(i.charAt(0) - 'a');
                int index2 = usf.findRoot(i.charAt(3) - 'a');
                if (index1 == index2) {
                    return false;
                }
            }
        }
        return true;
    }
}

class UnionFindSet {
    public int[] elem;

    public UnionFindSet(int n) {
        this.elem = new int[n];
        Arrays.fill(elem, -1);
    }

    public int findRoot(int x) {
        if (x < 0) {
            throw new IndexOutOfBoundsException("下标越界异常");
        }
        while (elem[x] >= 0) {
            x = elem[x];
        }

        return x;
    }

    public void union(int x1, int x2) {
        int index1 = findRoot(x1);
        int index2 = findRoot(x2);

        if (index1 == index2) {
            return;
        }
        elem[index1] = elem[index1] + elem[index2];
        elem[index2] = index1;
    }
}
相关推荐
元亓亓亓1 小时前
考研408--数据结构--day13--平衡二叉树&红黑树
数据结构·红黑树·平衡二叉树·408
王老师青少年编程11 小时前
csp信奥赛c++高频考点假期集训(分模块进阶)
数据结构·c++·算法·csp·高频考点·信奥赛·集训
Bear on Toilet13 小时前
递归_二叉树_50 . 从前序与中序遍历序列构造二叉树
数据结构·算法·leetcode·深度优先·递归
ArturiaZ16 小时前
【day29】
数据结构·c++·算法
Stringzhua18 小时前
队列-优先队列【Queue3】
java·数据结构·队列
季明洵1 天前
数据在内存中的存储
数据结构·算法·c
阿昭L1 天前
AVL树及其计算
数据结构
云深处@1 天前
【数据结构】树&&堆
数据结构
星火开发设计1 天前
关联式容器:map 与 multimap 的键值对存储
java·开发语言·数据结构·c++·算法