KM算法的时间复杂度,为什么可以降低一个数量级

背景知识

KM算法的作者是Kuhn-Munkras,发明时间在1960年左右,你随手百度一把就能找到不少相关资料,这里我就不重复罗列了,稍微归总一下基于二分图匹配相关的几个算法。

具体可以参考这篇文章:浅谈KM算法

算法性能的平均方式

算法性能的评价标准一般基于两种方式进行衡量:时间复杂度和空间复杂度。设计良好的算法,一般都会把时间和空间复杂度做到最优的状态,但是如果时间复杂度和空间复杂度只能选其一的话,一般都会优先考虑时间复杂度。毕竟,现在计算机的内存已经越来越便宜,而时间却越来越宝贵,用空间换时间就是一种良好的对策。

为什么KM需要考虑时间复杂度

KM算法如果不进行任何优化,原始默认的时间复杂度是: <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n 4 ) O(n^4) </math>O(n4)

n: 表示二分匹配的顶标数目。

下面我用一个更通俗的故事来表示,为什么这个复杂度是 : <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n 4 ) O(n^4) </math>O(n4)

故事如下

假设你是糖果工厂的小班长,要把3种不同颜色的糖果(红、蓝、绿)分给3个小朋友(小明、小红、小刚)。每个小朋友对不同颜色的糖果有不同的"喜爱值",比如小明特别喜欢红色糖(值5分),小红最爱蓝色糖(值4分)等等。你的任务是让每个小朋友都分到一颗糖,并且让总"喜爱值"最高。

原始方法(慢吞吞的O(n⁴))
  1. 第一步:随便分

    比如先给小明红糖果(5分),小红蓝糖果(4分),小刚绿糖果(3分)。总和是5+4+3=12分。

  2. 第二步:检查有没有更好的分法

    你觉得小刚可能更喜欢蓝糖果?于是重新调整:小明红糖果(5)、小红绿糖果(2)、小刚蓝糖果(4)。总和是5+2+4=11分,反而更差了!于是再换回来。

  3. 问题来了

    每调整一次,都要从头开始计算所有可能的分法。

    计算方式如下:

    小朋友数:3

    糖果数:3

    总分法: 3 * 3 = 9

    在最坏的情况下,每次都分错了,分错的总次数:3 * 3 = 9

    所以总共尝试次数就是: 3 * 3 * 3 * 3 = 81

    得到时间复杂度: <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n 2 ) ∗ O ( n 2 ) = O ( n 4 ) O(n^2)*O(n^2)=O(n^4) </math>O(n2)∗O(n2)=O(n4)

优化方法(聪明的O(n³))

秘诀:用笔记本记录重要信息!

  1. 第一步:分糖果时做笔记
    比如第一次分完后,你发现小红和小刚都喜欢蓝糖果,但小红更喜欢。于是你在笔记本上写:"下次优先把蓝糖果给小红"。
  2. 第二步:按笔记调整
    下次调整时,不用从头开始,直接看笔记本:蓝糖果已经给小红了,小刚只能选其他颜色。这样跳过了很多重复的尝试。
  3. 结果
    每次调整只需要检查剩下的可能性,不用从头再来。如果有100个小朋友,大约只需要试100×100×100(一百万次),比之前快了一百倍!这就是O(n³)。
🌈 核心思想总结
  • 原始方法:像没头苍蝇一样乱试,每次都要从头开始。
  • 优化方法:用"笔记本"记住谁喜欢什么,避免重复劳动。

时间复杂度就像数数:

  • 原始方法数数:1,2,3...10 → 要数10次,但每次都要重新从1开始,实际数了10×10=100次。
  • 优化方法数数:1,2,3...10 → 直接记住数到哪里了,只数10次。

结论:记住中间结果(笔记本)让算法聪明多了!

KM算法的时间复杂度

原始KM算法的时间复杂度

根据我的学习,原始的KM算法在最坏情况下的时间复杂度是O(n^4),其中n是图中顶点的数量。这个复杂度来源于算法的几个关键步骤:

  1. 初始化标号:为每个顶点分配初始标号。
  2. 寻找相等子图:基于标号构建一个包含所有顶点的子图,其中边的权重等于两端标号之和。
  3. 寻找完美匹配:在相等子图中尝试找到一个完美匹配。如果找不到,调整标号并重复。

在原始的实现中,每次调整标号后可能需要重新开始寻找匹配,这导致了较高的时间复杂度。

优化的KM算法

后来,人们对KM算法进行了优化,使其时间复杂度降低到O(n^3)。主要的优化点包括:

  1. 松弛边的处理:通过更高效的方式更新和维护可行顶标,减少不必要的计算。
  2. 使用广度优先搜索(BFS)或深度优先搜索(DFS) :在寻找增广路径时,采用更高效的搜索策略。
  3. 避免重复计算:通过维护一些中间结果,避免在每次迭代中重复相同的计算。
相关推荐
程序员清风6 分钟前
Redis Pipeline 和 MGET,如果报错了,他们的异常机制是什么样的?
java·后端·面试
审计侠32 分钟前
Go语言-初学者日记(四):包管理
开发语言·后端·golang
Aska_Lv39 分钟前
Linux---jstat命令的作用
后端
weisian15144 分钟前
力扣经典算法篇-9-跳跃游戏(贪心算法,反向递推)
算法·leetcode·游戏
Moonbit1 小时前
双周报Vol.69: C FFI 支持 borrow、新增.mbt.md测试与调试、WASM 后端支持extern type..
程序员
嘻嘻哈哈开森1 小时前
从零开始学习模型蒸馏
人工智能·后端
MCYH02061 小时前
C++抽卡模拟器
java·c++·算法·概率·原神
pystraf1 小时前
P10587 「ALFR Round 2」C 小 Y 的数 Solution
数据结构·c++·算法·线段树·洛谷
ゞ 正在缓冲99%…1 小时前
leetcode221.最大正方形
java·算法·动态规划
DataFunTalk1 小时前
大模型时代数据科学岗位的未来思考
前端·后端·算法