《最小生成树算法详解:Kruskal的优雅实现》

前置知识和本篇介绍

Kruskal算法需要借助以下两种数据结构。请读者朋友务必掌握后再阅读此篇。
前置知识: 数据结构:优先级队列[可以用排序替代]- 数据结构:并查集

编程语言:Java/C++.

不是所有图算法都要依赖建图,Kruskal算法是典型的不建图就可以用的图算法之一。

本篇介绍---最小生成树的概念以及Kruskal算法(读作克鲁斯卡尔算法, 一般可以用K算法代称)。 另外最小生成树算法还有一个Prim算法(普林算法), 这一篇我发到另一篇文章[探究经典Prim算法写法](https://blog.csdn.net/2303_79972050/article/details/144041234?spm=1001.2014.3001.5501)

《最小生成树算法详解:Kruskal的优雅实现》


一. 引言

  • 什么是最小生成树(MST)?
  • 简要介绍 Kruskal 算法的核心思想和优势。

一家通信公司试图建立其各个计算机中心的通信联系。

它可以通过租用电话线连接任意之间的一对, 但不过这样成本太高了。

能保证计算机中心能两两之间有通路即可吗?

比如这样以下的一个无向图, 如何保证其连通呢?

离散数学告诉我们, 简单连通无向图保证连通性是一棵树, 树状结构就可以保证连通性, 这棵树叫做生成树。

而这个图还带有权值, 由此衍生处一个最小生成树的概念。即生成树各边的权值之和最小的生成树。

以下是来自wiki的图,顶点表示计算机中心, 顶点之间用边表示, 其中边带有属性的权值就是费用。

从一个图中抽掉那些高昂的费用但不破坏图的连通性。

由于我们只需要保证连通和最低费用就可以了。 任意两个顶点之间只需要一条边连接就足够了。(生成树)

那么,按照上述删除连通无向图中的边的最终结构会形成一棵树(如下图黑色的边形成的树)。
这棵树就是最小生成树。

最小生成树的两种算法都是基于贪心的策略, 即寻找局部最优解。

Kruskal算法是一种贪心算法, 它从边的角度出发, 用于带权无向图在寻找最小生成树。

下面讲述最小生成树的性质和算法流程。

2. 最小生成树的性质

  • 什么图具有最小生成树:
    *
    1. 满足无向,带权,连通这些特征的图具有最小生成树。
      1. 生成树对于无向连通图的概念, 最小生成树要针对带权图, 否则就无"最小"的概念。
      1. 生成树存在是最小生成树存在的必要条件, 对于无向带权图来说,只要存在一棵生成树, 那么最小生成树就是它本身; 如果存在多棵生成树, 那么最小生成树就是生成树权值比较最小的结果。
  • 最小生成树的定义:
    • 连通图中所有的顶点并且边权重之和最小的树结构。
  • 相关性质:
    • 最小生成树本质是树结构, 它满足树的性质
    • 生成树的边数为 n − 1 n-1 n−1,n是无向连通图的顶点个数。
    • 不会成环。
    • 如何判断最小生成树是否存在? 道理很简单,dfs或者bfs判断连通性即可, 或者可以统计边数是否满足n-1(下面的代码也是通过这种方式证明最小生成树不存在的)。
  • 最小生成树不唯一:
    最小生成树的权值要求最小,但边的组织可能不同, 因此结构并不唯一。 存在多种最小生成树结构(最小权重和是相同的)。

3. Kruskal 算法详解

  • 3.1 Kruskal 的核心思想
    • 每次选择最小的边, 将边添加进最小生成树结构里。期间可能存在成环情况(这里借助并查集判环, 具体细节看代码部分 ), 直到添加n-1条边结束。
  • 3.2 算法流程
    *
    1. 若题目中给了图或者可以选择一种建图方式自己建好图, 遍历图中所有的边将它们排好序; 或者,收集好边的信息(两个端点, 权重)
      1. 按边权值升序排序。
      1. 使用并查集判断边是否形成环。(具体逻辑是判断两个端点是否在同一集合, 若存在则端点已经添加进最小生成树了必须舍弃该边; 否则加入最小生成树,并两个端点合并到一个集合)
      1. 逐步加入边,直到添加到n-1条边为止。
  • 3.3 为什么正确性
    基于贪心的策略, 每次选择权值最小的边且这条边不会成环或破坏连通性。 局部最优 == 全局最优。严格证明不必纠结。
    如果读者纠结证明可以阅读相关帖子, 算法导论, 或者直接读原作者的论文。

4. Kruskal 算法的实现

  • 4.1 数据结构选择
    • 使用并查集(Union-Find)O(1)的时间进行合并, 高效地检测环。
    • 前面可以通过排序数组, 可以选择优先级队列或者更多广泛的堆结构(可合并堆)。
  • 4.2 实现细节
    • 对边信息的处理
    • 并查集实现:路径压缩,按秩优化(我这里代码并未实现)
  • 4.3 Java代码实现
    Kruskal模板题
java 复制代码
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import java.io.StreamTokenizer;
import java.util.Arrays;
public class Main{
    //最大数据量
    public static int MAXN = 5001;
    public static int MAXM = 200001;
    
    //并查集模板数组
    public static int[] father = new int[MAXN];
    
    //边信息的处理
    public static int[][] edges = new int[MAXM][3];
    
    public static int n, m;
    
    //初始化并查集
    public static void build(int n){
        for(int i=1;i<=n;i++){
            father[i] = i;
        }
    }
    //向上找标记节点,并完成路径压缩
    public static int find(int i){
        if(i != father[i]){
            father[i] = find(father[i]);
        }
        return father[i];
    }
    //x,y不属于同一个集合就合并返回true
    //否则返回false.
    public static boolean union(int x,int y){
        int fx = find(x);
        int fy = find(y);
        if(fx == fy){
            return false;
        }else{
            father[fx] = fy;
            return true;
        }
    }
    public static void main(String[] args) throws IOException{
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StreamTokenizer in = new StreamTokenizer(br);
        PrintWriter out = new PrintWriter(new OutputStreamWriter(System.out));
        while(in.nextToken() != StreamTokenizer.TT_EOF){
            n = (int)in.nval;
            in.nextToken();
            m = (int)in.nval;
            build(n);
            for(int i=1;i<=m;i++){
                in.nextToken();
                edges[i][0] = (int)in.nval;
                in.nextToken();
                edges[i][1] = (int)in.nval;
                in.nextToken();
                edges[i][2] = (int)in.nval;
            }
            //Kruskal依赖边权值的有序性
            //比较器快排一下。
            Arrays.sort(edges,1,m+1,(a,b) -> a[2] - b[2]);
            int ans = 0;
            int count = 0;
            //遍历所有边
            for(int[] edge : edges){
                //边的两个顶点不在并查集里, 合并两个并查集
                //将边添加进最小生成树中。
                if(union(edge[0], edge[1])){
                    count++;
                    ans += edge[2];
                }
            }
            out.println(count == n-1 ? ans : "orz");
        }
        out.flush();
        out.close();
        br.close();
    }
}

C++代码实现

cpp 复制代码
#include <bits/stdc++.h>
using namespace std;

#define MAXN 5001
#define MAXM 20001

int father[MAXN];
vector<array<int, 3>> edge;
int n, m;

// 初始化并设置父节点
static void build(int n) {
    for (int i = 1; i <= n; i++) {
        father[i] = i;
    }
}

// 查找父节点并进行路径压缩
static int find(int i) {
    if (i != father[i]) {
        father[i] = find(father[i]);  // 路径压缩
    }
    return father[i];
}

// 合并两个集合
static bool union_sets(int x, int y) {
    int fx = find(x), fy = find(y);
    if (fx != fy) {
        father[fx] = fy;  // 合并
        return true;
    }
    return false;
}

int main(void) {
    cin >> n >> m;

    build(n);

    edge.resize(m);
    
    // 输入边数据
    for (int i = 0; i < m; i++) {
        cin >> edge[i][0] >> edge[i][1] >> edge[i][2];
    }

    // 按照边权重升序排序(a[2] 是权重,b[2] 是权重)
    sort(edge.begin(), edge.end(), [](const array<int, 3>& a, const array<int, 3>& b) {
        return a[2] < b[2];  // 比较权重
    });

    int cnt = 0;  // 记录最小生成树的边数
    int ans = 0;  // 记录最小生成树的权重

    for (const auto& e : edge) {
        if (union_sets(e[0], e[1])) {
            cnt++;
            ans += e[2];
        }
    }

    // 判断是否生成了最小生成树
    if (cnt == n - 1) {
        printf("%d\n", ans);
    } else {
        printf("orz\n");
    }

    return 0;
}

5. Kruskal 算法的时间复杂度分析

时间复杂度: O ( m l o g m + n + m ) O(mlogm + n + m) O(mlogm+n+m)

收集边的信息,对边按权值排序, 遍历边生成最小生成树。

并查集操作 O ( 1 ) O(1) O(1)

6. Kruskal 算法的优缺点

  • 优点:
    • 适合稀疏图(边数较少)。
    • 算法逻辑清晰易懂。
  • 缺点:
    • 需要对边排序,复杂度较高。
    • 不适合边权值频繁动态更新的情况。

结语

Java/C++简单明了的逻辑和优雅的实现方式。在某些特殊情况下,算法的效率可能受到边排序和并查集操作的影响,但由于不用建图,且非常好写, K算法非常受欢迎。

笔者才疏学浅, 对于图论算法仅仅只有点到为止的理解。希望通过这篇文章,我的拙见能帮助您能对Kruskal算法有更深入的了解,并能够根据实际问题选择合适的算法。

无论是在面对稀疏图时的高效表现,还是在理解最小生成树的过程中,Kruskal都为我们提供了一个宝贵的思路和工具。

对于有另一个生成树算法Prim感兴趣的读者,别忘了查看相关的Prim算法讨论,它是另一个重要的最小生成树算法,虽然实现方式与Kruskal有所不同,但同样发挥着重要作用。

祝你在算法学习之路上越走越远!

前面一篇写得太烂了, 偷偷删除,同时补充C++代码重新发一遍...

相关推荐
半盏茶香9 分钟前
扬帆数据结构算法之雅舟航程,漫步C++幽谷——LeetCode刷题之移除链表元素、反转链表、找中间节点、合并有序链表、链表的回文结构
数据结构·c++·算法
是梦终空10 分钟前
JAVA毕业设计210—基于Java+Springboot+vue3的中国历史文化街区管理系统(源代码+数据库)
java·spring boot·vue·毕业设计·课程设计·历史文化街区管理·景区管理
哎呦,帅小伙哦17 分钟前
Effective C++ 规则41:了解隐式接口和编译期多态
c++·effective c++
CodeJourney.29 分钟前
小型分布式发电项目优化设计方案
算法
基哥的奋斗历程35 分钟前
学到一些小知识关于Maven 与 logback 与 jpa 日志
java·数据库·maven
m0_5127446435 分钟前
springboot使用logback自定义日志
java·spring boot·logback
十二同学啊39 分钟前
JSqlParser:Java SQL 解析利器
java·开发语言·sql
老马啸西风1 小时前
Plotly 函数图像绘制
java
DARLING Zero two♡1 小时前
【初阶数据结构】逆流的回环链桥:双链表
c语言·数据结构·c++·链表·双链表
9毫米的幻想1 小时前
【Linux系统】—— 编译器 gcc/g++ 的使用
linux·运维·服务器·c语言·c++