(高阶数据结构)并查集

并查集

并查集

原理

在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个

单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一

个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find

set)。

比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不

同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3,

4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个

数。

现在0集合有7个人,2集合有3个人,总共两个朋友圈。

特点:

1、一个位置值是负数,那他就是树的根,这个负数绝对值就是这颗树数据个数。

2、一个位置值是正数,那他就是双亲的下标。

通过以上例子可知,并查集一般可以解决一下问题:

  1. 查找元素属于哪个集合
    沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
  2. 查看两个元素是否属于同一个集合
    沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  3. 将两个集合归并成一个集合
    将两个集合中的元素合并
    将一个集合名称改成另一个集合的名称
  4. 集合的个数
    遍历数组,数组中元素为负数的个数即为集合的个数。

实现

思路说明

  • 找到节点对应的双亲
    根据数组存储的值寻根
  • 如何让节点成为孩子?
    将孩子的值加到父亲,孩子位置存储父亲的位置(将较小的元素作为根)
  • 判断元素在不在一个集合==判断两个元素的根相不相同
  • 计算集合的个数

代码实现

cpp 复制代码
#pragma once
#include<iostream>
#include<vector>
using namespace std;

class UnionFindSet
{
public:
	UnionFindSet(size_t n)
		:_ufs(n,-1)
	{ }
	//合并
	void Union(int x1, int x2)
	{
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);
		//如果本身就在一个集合,不用合并
		if (root1 == root2)
			return;
		//把值小的作为根
		if (root1 > root2)
			swap(root1, root2);
		_ufs[root1] += _ufs[root2];
		_ufs[root2] = root1;
	}
	//找节点的根
	int FindRoot(int x)
	{
		int parent = x;
		while (_ufs[parent] >= 0)
		{
			parent = _ufs[parent];
		}
		return parent;
	}
	//判断是否在一个集合
	bool InSet(int x1,int x2)
	{
		return FindRoot(x1) == FindRoot(x2);
	}
	//计算集合的个数
	size_t SetSize()
	{
		size_t size = 0;
		for (size_t i = 0;i < _ufs.size();i++)
		{
			if(_ufs[i]<0)
			{
				++size;
			}
		}
		return size;
	}
private:
	vector<int> _ufs;
};

例题

省份数量

LeetCode - 省份数量

有 n 个城市,其中一些彼此相连,另一些没有相连。如果城市 a 与城市 b 直接相连,且城市 b 与城市 c 直接相连,那么城市 a 与城市 c 间接相连。

省份 是一组直接或间接相连的城市,组内不含其他没有相连的城市。

给你一个 n x n 的矩阵 isConnected ,其中 isConnected[i][j] = 1 表示第 i 个城市和第 j 个城市直接相连,而 isConnected[i][j] = 0 表示二者不直接相连。

返回矩阵中 省份 的数量。

题解

使相连的城市进入并查集的同一个集合,最后返回集合的数量即可

cpp 复制代码
//将并查集类粘贴进来
class Solution {
public:
    int findCircleNum(vector<vector<int>>& isConnected) {
        UnionFindSet ufs(isConnected.size());
        //isConnected.size()获取的是二维数组的行数!
        for(size_t i=0;i<isConnected.size();++i)
        {
            //j<isConnected[i].size()获取的是二维数组的列数!
            for(size_t j=0;j<isConnected[i].size();++j)
            {
                if(isConnected[i][j]==1)
                {
                    ufs.Union(i,j);
                }
            }
        }
        return ufs.SetSize();
    }
};

不利用并查集直接去写

cpp 复制代码
class Solution {
public:
	int findCircleNum(vector<vector<int>>& isConnected) {
		// 手动控制并查集
		vector<int> ufs(isConnected.size(), -1);
		// 查找根(利用lambda表达式简洁实现)
		auto findRoot = [&ufs](int x)
			{
				while (ufs[x] >= 0)
					x = ufs[x];
				return x;
			};
		for (size_t i = 0; i < isConnected.size(); ++i)
		{
			for (size_t j = 0; j < isConnected[i].size(); ++j)
			{
				if (isConnected[i][j] == 1)
				{
					// 合并集合
					int root1 = findRoot(i);
					int root2 = findRoot(j);
					if (root1 != root2)
					{
						ufs[root1] += ufs[root2];
						ufs[root2] = root1;
					}
				}
			}
		}
		int n = 0;
		for (auto e : ufs)
		{
			if (e < 0)
				++n;
		}
		return n;
	}
};

路径压缩思路:数据量极大时,将多层的树压缩成高度为二的树(所有节点都去做2的孩子),减少寻根的消耗

在FindRoot函数中增加逻辑,边找边压缩(数据量小的时候不需要使用)

等式方程的可满足性

LeetCode - 等式方程的可满足性

解题思路:

  1. 将所有"=="两端的字符合并到一个集合中
  2. 检测"!=" 两端的字符是否在同一个结合中,如果在,则不满足,如果不在。则满足
cpp 复制代码
class Solution {
public:
	bool equationsPossible(vector<string>& equations) {
		vector<int> ufs(26, -1);
		auto findRoot = [&ufs](int x)
			{
				while (ufs[x] >= 0)
					x = ufs[x];

				return x;
			};
		// 第一遍,先把相等的值加到一个集合中
		for (auto& str : equations)
		{
			if (str[1] == '=')
			{
				int root1 = findRoot(str[0] - 'a');
				int root2 = findRoot(str[3] - 'a');
				if (root1 != root2)
				{
					ufs[root1] += ufs[root2];
					ufs[root2] = root1;
				}
			}
		}
		// 第一遍,先把不相等在不在一个集合,在就相悖了
		// 返回false
		for (auto& str : equations)
		{
			if (str[1] == '!')
			{
				int root1 = findRoot(str[0] - 'a');
				int root2 = findRoot(str[3] - 'a');
				if (root1 == root2)
				{
					return false;
				}
			}
		}
		return true;
	}
};
相关推荐
im_AMBER2 小时前
Leetcode 121 翻转二叉树 | 二叉树中的最大路径和
数据结构·学习·算法·leetcode
数智工坊2 小时前
【数据结构-排序】8.3 简单选择排序-堆排序
数据结构
programhelp_3 小时前
特斯拉 MLE 超详细面经 + 避坑
数据结构·人工智能·算法·面试·职场和发展
ShineWinsu4 小时前
对于C++中stack和queue的详细介绍
开发语言·数据结构·c++·面试·stl·queue·stack
样例过了就是过了6 小时前
LeetCode热题100 最大子数组和
数据结构·算法·leetcode
BackCatK Chen6 小时前
第十五章 吃透C语言结构与数据形式:struct/union/typedef全解析
c语言·开发语言·数据结构·typedef·结构体·函数指针·联合体
m0_531237177 小时前
C语言-变量,枚举常量,字符串,打印类型,转义字符
c语言·数据结构·算法
zyeyeye7 小时前
自定义类型:结构体
c语言·开发语言·数据结构·c++·算法
ShineWinsu9 小时前
对于模拟实现C++list类的详细解析—上
开发语言·数据结构·c++·算法·面试·stl·list