并查集(力扣1971)

并查集的功能:判断两个节点是否在同一个集合中/将两个节点加入同一集合中。模板如下:

cpp 复制代码
#include<iostream>
#include<vector>
using namespace std;
const int n = 1e6 + 5;//视题目具体节点数量而定,比节点数量稍大即可
vector<int>father(n, 0);

//并查集初始化
void init()
{
	for (int i = 0; i < n; i++)
	{
		father[i] = i;
	}
}
//寻根,路径压缩
int find(int u)
{
	if (u == father[u]) return u;
	else father[u] = find(father[u]);
	return father[u];
}
//判断u和v是否找到同一个根
bool issame(int u, int v)
{
	u = find(u);
	v = find(v);
	return u == v;
}
//将v->u这条边加入并查集
void join(int u, int v)
{
	u = find(u);
	v = find(v);
	if (u == v) return;
	father[v] = u;
}

我们用一个father数组,存储每个集合的"根"(可以将集合抽象为一棵n叉树)。

初始时,每个节点自己为一个集合,因此它们的根都是本身。

寻根时,我们使用路径压缩的方式。将集合抽象为一棵n叉树后,为了方便判断两个节点的根是否相同,我们尽可能地让在同一个集合中的节点都直接与该集合的"根"连接,这样尽可能地缩小了这棵n叉树的高度,因而在查询的时候就提高了效率。

如何路径压缩?就是在寻找节点u的根的过程中,让它的父节点father[u]承接住find(father[u])。形象地说,如果u有爷爷,那么就让father[u]成为u的爷爷,如果u有曾祖父,那就让father[u]成为u的曾祖父...

接着就是判断两个节点是否在同一个集合中,也就是判断它们的根是否相同。

然后就是将两个节点u和v加入。如果u和v的祖先相同,那就不用加入了,否则就让v的父亲为u.

提出疑问:模板中,isSame函数与join函数是否有一部分重复了?能否归并为如下形式?

cpp 复制代码
// 判断 u 和 v是否找到同一个根
bool isSame(int u, int v) 
{
    u = find(u);
    v = find(v);
    return u == v;
}

// 将v->u 这条边加入并查集
void join(int u, int v) 
{
    if (isSame(u, v)) return ; 
    father[v] = u;
}

这么写是有问题的,在join函数中 我们需要寻找 u 和 v 的根,然后再进行连线在一起,而不是直接 用 u 和 v 连线在一起。

举个例子:

cpp 复制代码
join(1, 2);
join(3, 2);

此时构成的图应该为:2->1,2->3

此时问 1,3是否在同一个集合,我们调用 join(1, 2); join(3, 2); 很明显本意要表示 1,3是在同一个集合。

但当我们调用 isSame(1, 3)的时候,find(1) 返回的是1,find(3)返回的是3。 return 1 == 3 返回的是false,代码告诉我们 1 和 3 不在同一个集合,这明显不符合我们的预期。问题出在我们精简的代码上,即 join 函数 一定要先通过find函数寻根再进行关联。

正确模拟:

cpp 复制代码
void join(int u, int v)
{
	u = find(u);
	v = find(v);
	if (u == v) return;
	father[v] = u;
}

join(1,2):使得2->1.

join(3,2):由于要找祖先,所以会使得1->3.

这么一来,图就变成了:2->1->3,显然达到了我们预期的效果。因为在join函数里,我们有find函数进行寻根的过程,这样就保证元素 1,2,3在这个有向图里是强连通的。

我们回到题目上。这道题显然是用并查集。先看错误示例:

cpp 复制代码
class Solution
{
public:
    int find(vector<int>& father, int index)
    {
        if (index == father[index])
        {
            return index;
        }
        return father[index] = find(father, father[index]);
    }
    void join(vector<int>& father, int u, int v)
    {
        u = find(father, u);
        v = find(father, v);
        if (u == v) return;
        father[v] = u;
    }
    bool validPath(int n, vector<vector<int>>& edges, int source, int destination)
    {
        vector<int>father(n);
        for (int i = 0; i < n; i++)
        {
            father[i] = i;
        }
        for (auto p : edges)
        {
            join(father, p[0], p[1]);
        }
        return father[source] == father[destination];
    }
};

如果edge为:

cpp 复制代码
[[4,3],[1,4],[4,8],[1,7],[6,4],[4,2],[7,4],[4,0],[0,9],[5,4]]

我们来模拟一下。

step1:father[3]=4

step2:father[4]=1

走到这里,实际上已经可以发现问题了。如果source=3,destination=4,那么由于father[source]==4!=father[destination]==1,会返回false,但实际上是true.

也就是说,路径压缩是具有惰性的。如果没有调用find函数,father[u]仍然可能指向某个中间节点。

因此,我们真正需要判断的是,source和destination是否同根,而不是它们的父亲是否相同。

正确代码:

cpp 复制代码
class Solution
{
public:
    int find(vector<int>& father, int index)
    {
        if (index == father[index])
        {
            return index;
        }
        return father[index] = find(father, father[index]);
    }
    void join(vector<int>& father, int u, int v)
    {
        u = find(father, u);
        v = find(father, v);
        if (u == v) return;
        father[v] = u;
    }
    bool validPath(int n, vector<vector<int>>& edges, int source, int destination)
    {
        vector<int>father(n);
        for (int i = 0; i < n; i++)
        {
            father[i] = i;
        }
        for (auto p : edges)
        {
            join(father, p[0], p[1]);
        }
        return find(father, source) == find(father, destination);
    }
};
相关推荐
codists2 小时前
《算法导论(第4版)》阅读笔记:p14-p16
算法
zilpher_wang2 小时前
K-means
算法·机器学习·kmeans
柃歌2 小时前
【LeetCode Solutions】LeetCode 176 ~ 180 题解
数据结构·数据库·sql·算法·leetcode
袁气满满~_~2 小时前
LeetCode:101、对称二叉树
算法·leetcode·职场和发展
How_doyou_do3 小时前
Dijkstra
算法
赵和范3 小时前
C++:书架
开发语言·c++·算法
tmiger4 小时前
图像匹配导航定位技术 第 10 章
人工智能·算法·计算机视觉
wuxiguala4 小时前
【文件系统—散列结构文件】
linux·算法
keepDXRcuriosity4 小时前
深入探索快速排序算法:原理与 C 语言实现
c语言·算法·排序算法
flying_13145 小时前
面试常问系列(一)-神经网络参数初始化-之-softmax
深度学习·神经网络·算法·机器学习·面试