Louvain 算法

1. Louvain 算法是什么?

Louvain 是一种经典的图社区发现算法(Community Detection),由 Blondel 等人在 2008 年提出。核心目标:

通过最大化 Modularity(模块度)来自动划分图中的社区(cluster)。

它最大的特点是:

✔ 速度非常快

✔ 能处理百万级节点的大图

✔ 结果相对稳定

2. 算法原理(核心思想)

2.1 模块度(Modularity)Q

算法的目标是最大化模块度 Q。

模块度衡量的是社区内部的边密度与随机网络期望边密度的差值:
模块度越大,说明社区划分越好。 边密度(Edge Density)是图论中的一个概念,用来衡量一个图或一个社区内部的边有多"密集"。

边密度 = 实际有的边数量 / 理论上最多可能有的边数量

如果接近 1,说明边很密、节点之间关系非常紧密;接近 0 则关系稀疏。

2.2 Louvain 的两阶段迭代结构

阶段 1:局部节点移动(Local Moving Phase)

目标:通过不断移动节点,使模块度尽可能增加。

步骤:

复制代码
	初始时,每个节点自成一个社区
	
	遍历每个节点,将其尝试移动到相邻节点所在的社区
	
	如果移动能使模块度 ΔQ > 0,则执行移动
	
	重复直到没有任何移动能提升 Q

输出:一组较优的社区划分。

阶段 2:社区聚合(Community Aggregation Phase)

目标:将上一步得到的社区 压缩成超节点,构造新图并继续迭代。

做法:

复制代码
	每个社区变成一个"超节点"
	
	社区之间的边权为原图中所有跨社区边权的总和
	
	在新图上重复阶段 1

这个过程会多次迭代,直到模块度不再提升。

压缩成超节点:把一个社区中的所有节点"融合"为一个新的节点(super node)来重新构图。

这样做的目的是让下一轮算法在一个更小、更简化的图上继续优化模块度,从而不断逼近更好的社区划分。

相关推荐
颜酱2 小时前
图结构完全解析:从基础概念到遍历实现
javascript·后端·算法
m0_736919102 小时前
C++代码风格检查工具
开发语言·c++·算法
yugi9878382 小时前
基于MATLAB强化学习的单智能体与多智能体路径规划算法
算法·matlab
喵手2 小时前
Python爬虫实战:旅游数据采集实战 - 携程&去哪儿酒店机票价格监控完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集结果csv导出·旅游数据采集·携程/去哪儿酒店机票价格监控
2501_944934732 小时前
高职大数据技术专业,CDA和Python认证优先考哪个?
大数据·开发语言·python
helloworldandy2 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
DuHz2 小时前
超宽带脉冲无线电(Ultra Wideband Impulse Radio, UWB)简介
论文阅读·算法·汽车·信息与通信·信号处理
Polaris北极星少女3 小时前
TRSV优化2
算法
代码游侠3 小时前
C语言核心概念复习——网络协议与TCP/IP
linux·运维·服务器·网络·算法
2301_763472463 小时前
C++20概念(Concepts)入门指南
开发语言·c++·算法