Louvain 算法

1. Louvain 算法是什么?

Louvain 是一种经典的图社区发现算法(Community Detection),由 Blondel 等人在 2008 年提出。核心目标:

通过最大化 Modularity(模块度)来自动划分图中的社区(cluster)。

它最大的特点是:

✔ 速度非常快

✔ 能处理百万级节点的大图

✔ 结果相对稳定

2. 算法原理(核心思想)

2.1 模块度(Modularity)Q

算法的目标是最大化模块度 Q。

模块度衡量的是社区内部的边密度与随机网络期望边密度的差值:
模块度越大,说明社区划分越好。 边密度(Edge Density)是图论中的一个概念,用来衡量一个图或一个社区内部的边有多"密集"。

边密度 = 实际有的边数量 / 理论上最多可能有的边数量

如果接近 1,说明边很密、节点之间关系非常紧密;接近 0 则关系稀疏。

2.2 Louvain 的两阶段迭代结构

阶段 1:局部节点移动(Local Moving Phase)

目标:通过不断移动节点,使模块度尽可能增加。

步骤:

复制代码
	初始时,每个节点自成一个社区
	
	遍历每个节点,将其尝试移动到相邻节点所在的社区
	
	如果移动能使模块度 ΔQ > 0,则执行移动
	
	重复直到没有任何移动能提升 Q

输出:一组较优的社区划分。

阶段 2:社区聚合(Community Aggregation Phase)

目标:将上一步得到的社区 压缩成超节点,构造新图并继续迭代。

做法:

复制代码
	每个社区变成一个"超节点"
	
	社区之间的边权为原图中所有跨社区边权的总和
	
	在新图上重复阶段 1

这个过程会多次迭代,直到模块度不再提升。

压缩成超节点:把一个社区中的所有节点"融合"为一个新的节点(super node)来重新构图。

这样做的目的是让下一轮算法在一个更小、更简化的图上继续优化模块度,从而不断逼近更好的社区划分。

相关推荐
踏着七彩祥云的小丑2 小时前
pytest——Mark标记
开发语言·python·pytest
W23035765733 小时前
经典算法:最长上升子序列(LIS)深度解析 C++ 实现
开发语言·c++·算法
不爱吃炸鸡柳3 小时前
Python入门第一课:零基础认识Python + 环境搭建 + 基础语法精讲
开发语言·python
minji...4 小时前
Linux 线程同步与互斥(三) 生产者消费者模型,基于阻塞队列的生产者消费者模型的代码实现
linux·运维·服务器·开发语言·网络·c++·算法
Dxy12393102164 小时前
Python基于BERT的上下文纠错详解
开发语言·python·bert
语戚5 小时前
力扣 968. 监控二叉树 —— 贪心 & 树形 DP 双解法递归 + 非递归全解(Java 实现)
java·算法·leetcode·贪心算法·动态规划·力扣·
skywalker_115 小时前
力扣hot100-7(接雨水),8(无重复字符的最长子串)
算法·leetcode·职场和发展
SiYuanFeng5 小时前
Colab复现 NanoChat:从 Tokenizer(CPU)、Base Train(CPU) 到 SFT(GPU) 的完整踩坑实录
python·colab
bIo7lyA8v6 小时前
算法稳定性分析中的输入扰动建模的技术9
算法