【高阶数据结构】并查集

文章目录

一、并查集原理

在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find set)。

比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分队s3={2,3,5}就相互认识了,10个人形成了三个小团体。假设右三个群主0,1,2担任队长,负责大家的出行。

一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。

从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。

仔细观察数组中内融化,可以得出以下结论:

1.数组的下标对应集合中元素的编号

2.数组中如果为负数,负号代表根,数字代表该集合中元素个数

3.数组中如果为非负数,代表该元素双亲在数组中的下标

在公司工作一段时间后,西安小分队中8号同学与成都小分队1号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:

现在0集合有7个人,2集合有3个人,总共两个朋友圈。

并查集的特点:

1、一个位置值是负数,那他就是树的根,这个负数绝对值就是这颗树数据个数。

2、一个位置值是正数,那他就是双亲的下标

通过以上例子可知,并查集一般可以解决一下问题:

1.查找元素属于哪个集合

沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)

2.查看两个元素是否属于同一个集合

沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在

3.将两个集合归并成一个集合

将两个集合中的元素合并

将一个集合名称改成另一个集合的名称

4.集合的个数

遍历数组,数组中元素为负数的个数即为集合的个数。

二、并查集实现

cpp 复制代码
class UnionFindSet
{
private:
	std::vector<int> _set;

public:
	UnionFindSet(int n) : _set(n, -1) {}

	// 查找根节点
	int FindRoot(int x)
	{
		int root = x;
		while (_set[root] >= 0)
		{
			root = _set[root];
		}

		// 路径压缩
		while (_set[x] >= 0)
		{
			int parent = _set[x];
			_set[x] = root;
			x = parent;
		}

		return root;
	}

	bool InSet(int x1, int x2)
	{
		return FindRoot(x1) == FindRoot(x2);
	}

	// 合并
	void Union(int x1, int x2)
	{
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);
        
		// 如果本身就在一个集合就没必要合并了
		if (root1 == root2)
		{
			return;
		}

		// 控制数据量小的往大的集合合并
		if (abs(_set[root1]) > abs(_set[root2]))
		{
			std::swap(root1, root2);
		}

		_set[root1] += _set[root2];
		_set[root2] = root1;
	}

	// 返回根的数量
	size_t SetSize()
	{
		int count = 0;
		for (auto x : _set)
		{
			if (x < 0)
			{
				count++;
			}
		}

		return count;
	}
};

我们这里在查找根节点的时候可以进行路径的压缩,比如当前这棵树需要更新为另一个根的孩子,那么在查找根的时候,我们可以将路径上的节点的根节点置为根的孩子,这样后面再查找这些节点的根节点的时候就会很快,树的高低也可以降低。

我们在合并节点的时候,控制数据量小的往大的集合合并,这样也可以降低树的高度,后面在查找节点的根的时候就会变得更快,因为需要经过的节点个数更少

三、并查集应用

1.LeetCode 547.省份数量

这道题的思路为:将相连的省份进行合并,放入并查集中,然后在遍历并查集返回根节点的数量即可,代码如下:

cpp 复制代码
class Solution {
public:
    int findCircleNum(vector<vector<int>>& isConnected)
    {
        int n = isConnected.size();
        // 并查集
        vector<int> ufs(n,-1);

        auto FindRoot = [&](int x) -> int
        {
            while(ufs[x] >= 0)
                x = ufs[x];
            return x;
        };

        for(int i = 0;i<n;i++)
        {
            for(int j = 0;j < n;j++)
            {
                if(isConnected[i][j] == 1)
                {
                    int root1 = FindRoot(i);
                    int root2 = FindRoot(j);
                    if(root1 != root2)
                    {
                        ufs[root1] += ufs[root2];
                        ufs[root2] = root1;
                    }
                }
            }
        }

        int ret = 0;
        for(auto x : ufs)
        {
            if(x < 0)
                ret++;
        }

        return ret;
    }
};

2.LeetCode 990.等式方程的可满足性

解题思路:

1.将所有"=="两端的字符合并到一个集合中

2.检测"!=" 两端的字符是否在同一个结合中,如果在不满足,如果不在满足

cpp 复制代码
class Solution
{
public:
    bool equationsPossible(vector<string>& equations)
    {
        vector<int> ufs(26,-1);
        auto findRoot = [&ufs](int x) -> int
        {
            while(ufs[x] >= 0)
            {
                x = ufs[x];
            }
            return x;
        };

        // 第一遍,先把相等的值加到一个集合中
        for(auto &str : equations)
        {
            if(str[1] == '=')
            {
                int root1 = findRoot(str[0]-'a');
                int root2 = findRoot(str[3]-'a');
                if(root1 != root2)
                {
                    ufs[root1] += ufs[root2];
                    ufs[root2] = root1;
                }
            }
        }

        // 如果不相等的在一个集合中,则返回false
        for(auto &str : equations)
        {
            if(str[1] == '!')
            {
                int root1 = findRoot(str[0]-'a');
                int root2 = findRoot(str[3]-'a');
                if(root1 == root2)
                {
                    return false;
                }
            }
        }

        return true;
    }
};

Root(str[0]-'a');

int root2 = findRoot(str[3]-'a');

if(root1 == root2)

{

return false;

}

}

}

    return true;
}

};

复制代码
相关推荐
wheeldown6 小时前
【数据结构】选择排序
数据结构·算法·排序算法
躺不平的理查德10 小时前
数据结构-链表【chapter1】【c语言版】
c语言·开发语言·数据结构·链表·visual studio
阿洵Rain10 小时前
【C++】哈希
数据结构·c++·算法·list·哈希算法
Leo.yuan10 小时前
39页PDF | 华为数据架构建设交流材料(限免下载)
数据结构·华为
半夜不咋不困10 小时前
单链表OJ题(3):合并两个有序链表、链表分割、链表的回文结构
数据结构·链表
忘梓.11 小时前
排序的秘密(1)——排序简介以及插入排序
数据结构·c++·算法·排序算法
y_m_h14 小时前
leetcode912.排序数组的题解
数据结构·算法
1 9 J14 小时前
数据结构 C/C++(实验三:队列)
c语言·数据结构·c++·算法
921正在学习编程14 小时前
数据结构之二叉树前序,中序,后序习题分析(递归图)
c语言·数据结构·算法·二叉树
毕竟秋山澪14 小时前
岛屿数量 广搜版BFS C#
数据结构·算法·宽度优先