高阶数据结构——并查集

**1.**并查集原理

在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个
单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一
个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find
set)。
比如:某公司今年校招全国总共招生 10 人,西安招 4 人,成都招 3 人,武汉招 3 人, 10 个人来自不
同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号: {0, 1, 2, 3,
4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个
数。 ( 负号下文解释 )

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:西安学生小分队s1={0,6,7,8} ,成都学生小分队 s2={1,4,9} ,武汉学生小分队 s3={2,3,5} 就相互认识了,10 个人形成了三个小团体。假设右三个群主 0,1,2 担任队长,负责大家的出行。


一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。


从上图可以看出:编号 6,7,8 同学属于 0 号小分队,该小分队中有 4 人 ( 包含队长 0) ;编号为 4 和 9 的同
学属于 1 号小分队,该小分队有 3 人 ( 包含队长 1) ,编号为 3 和 5 的同学属于 2 号小分队,该小分队有 3
个人 ( 包含队长 1) 。

仔细观察数组中内融化,可以得出以下结论:

  1. 数组的下标对应集合中元素的编号
  2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标

在公司工作一段时间后,西安小分队中 8 号同学与成都小分队 1 号同学奇迹般的走到了一起,两个
小圈子的学生相互介绍,最后成为了一个小圈子:现在 0 集合有 7 个人, 2 集合有 3 个人,总共两个朋友圈。

通过以上例子可知,并查集一般可以解决一下问题:

  1. 查找元素属于哪个集合
    沿着数组表示树形关系以上一直找到根 ( 即:树中中元素为负数的位置 )
  2. 查看两个元素是否属于同一个集合
    沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  3. 将两个集合归并成一个集合
    将两个集合中的元素合并
    将一个集合名称改成另一个集合的名称
  4. 集合的个数
    遍历数组,数组中元素为负数的个数即为集合的个数。

2.并查集实现

cpp 复制代码
class UnionFindSet
{
public:
	// 初始时,将数组中元素全部设置为1
	UnionFindSet(size_t size)
		: _ufs(size, -1)
	{}
	// 给一个元素的编号,找到该元素所在集合的名称
	int FindRoot(int index)
	{
		// 如果数组中存储的是负数,找到,否则一直继续
		while (_ufs[index] >= 0)
		{
			index = _ufs[index];
		}

		return index;
	}
	bool Union(int x1, int x2)
	{
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);

		// x1已经与x2在同一个集合
		if (root1 == root2)
			return false;

		// 将两个集合中元素合并
		_ufs[root1] += _ufs[root2];

		// 将其中一个集合名称改变成另外一个
		_ufs[root2] = root1;
		return true;
	}
	// 数组中负数的个数,即为集合的个数
	size_t Count()const
	{
		size_t count = 0;
		for (auto e : _ufs)
		{
			if (e < 0)
				++count;
		}

		return count;
	}
private:
	vector<int> _ufs;
};

**3.**并查集应用

省份数量

cpp 复制代码
class Solution {
public:
	int findCircleNum(vector<vector<int>>& isConnected) {
		// 手动控制并查集
		vector<int> ufs(isConnected.size(), -1);
		// 查找根
		auto findRoot = [&ufs](int x)
			{
				while (ufs[x] >= 0)
					x = ufs[x];
				return x;
			};
		for (size_t i = 0; i < isConnected.size(); ++i)
		{
			for (size_t j = 0; j < isConnected[i].size(); ++j)
			{
				if (isConnected[i][j] == 1)
				{
					// 合并集合
					int root1 = findRoot(i);
					int root2 = findRoot(j);
					if (root1 != root2)
					{
						ufs[root1] += ufs[root2];
						ufs[root2] = root1;
					}
				}
			}
		}
		int n = 0;
		for (auto e : ufs)
		{
			if (e < 0)
				++n;
		}
		return n;
	}
};

等式方程的可满足性

cpp 复制代码
/*
解题思路:

1. 将所有"=="两端的字符合并到一个集合中

2. 检测"!=" 两端的字符是否在同一个结合中,如果在不满足,如果不在满足
*/
class Solution {
public:
	bool equationsPossible(vector<string>& equations) {
		vector<int> ufs(26, -1);
		auto findRoot = [&ufs](int x)
			{
				while (ufs[x] >= 0)
					x = ufs[x];

				return x;
			};
		// 第一遍,先把相等的值加到一个集合中
		for (auto& str : equations)
		{
			if (str[1] == '=')
			{
				int root1 = findRoot(str[0] - 'a');
				int root2 = findRoot(str[3] - 'a');
				if (root1 != root2)
				{
					ufs[root1] += ufs[root2];
					ufs[root2] = root1;
				}
			}
		}
		// 第一遍,先把不相等在不在一个集合,在就相悖了
		// 返回false
		for (auto& str : equations)
		{
			if (str[1] == '!')
			{
				int root1 = findRoot(str[0] - 'a');
				int root2 = findRoot(str[3] - 'a');
				if (root1 == root2)
				{
					return false;
				}
			}
		}
		return true;
	}
};
相关推荐
Helibo442 小时前
C++pair学习笔记
c++·笔记·学习
生信大杂烩2 小时前
Xenium数据分析 | 使用Xenium Ranger重新分析数据
python·数据分析
zl_dfq2 小时前
基于哈夫曼树的数据压缩算法
算法
多喝开水少熬夜2 小时前
算法-哈希表和相关练习-java
java·算法·散列表
xiaoye-duck2 小时前
数据结构之二叉树-堆
数据结构
郁大锤2 小时前
OpenAI responses使用教程(三) ——Responses create python SDK 介绍
人工智能·python·ai·openai
@syh.2 小时前
【C++】map和set
开发语言·c++
余衫马2 小时前
聚类算法入门:像魔法一样把数据自动归类
人工智能·算法·机器学习·聚类
拾光Ծ2 小时前
C++11实用的“新特性”:列表初始化+右值引用与偷懒艺术——移动语义
开发语言·c++