HGCN论文阅读

HGCN结构

本篇论文解决交通预测问题共分为五个部分,分别是谱聚类(Spectral Clustering)、区域图山的GCN(GCN on the Graph of Regions)、道路网络图山的GCN(GCN on the Graph of Road Network)、宏观图和微观图之间的交互层(Interaction Layer between Macro and Micro Graphs)、交通预测块(Traffic Forecasting Block)。

1 生成交通层次图(Spectral Clustering)

1.1 构建微观道路网络图

所谓 "微观" ,就是道路图上节点的交通数据(如速度、流量或密度)。

1.2 构建宏观区域图

所谓 "宏观区域" ,就是指把之前的微观节点聚类为一个区域。本文采用谱聚类方法,对道路网络图进行处理,从而构建区域的宏观图。如上图所示,一共分为4步:

  1. 获取邻接矩阵:首先从道路网络图中获得邻接矩阵。
  2. 谱聚类:对邻接矩阵的拉普拉斯矩阵进行谱聚类,将整个道路网络划分为若干簇。每个簇即视作区域图中的一个宏观节点。
  3. 区域特征计算:每个宏观节点(4个小点儿)的特征由该簇内所有微观节点特征的均值和最小值组合而成。
  4. 构造宏观图边:基于微观图构造宏观图。

2 区域图上的GCN(GCN on the Graph of Regions)

针对第一步中产生的基于区域的宏观图(Region Data),先来一个线性变换(Linear Transformation)对其进行初步转换。 其主要目的是将输入数据投影到一个新的特征空间,以便后续的图卷积操作能够更有效地学习数据表示。

python 复制代码
# 线性变换:将 in_dim(1) 维度转换为 residual_channels(32) 维度
self.start_conv_cluster = nn.Conv2d(in_channels=in_dim_cluster,
                                    out_channels=residual_channels,
                                    kernel_size=(1, 1))

input_c = input_cluster
x_cluster = self.bn_cluster(input_c)
x_cluster = self.start_conv_cluster(x_cluster)  # 关于区域图的特征张量

接下来,是连续的两次时空图卷积(S-T Block)。在第一个时空卷积块(S-T Block)中,采用一个较小的卷积核,感受野增长很慢,模型主要处理一些最近的数据。比如:突发事件、红绿灯导致的交通波动、局部区域的流量变化。

在第二个时空卷积块中,它的输入已经包含了过去几个时间步的汇总信息,因此可以处理处理更长时间范围的数据。比如:上下班高峰、天气影响、节假日模式。

python 复制代码
# 计算区域图的邻接矩阵 new_supports_cluster 
A_cluster = F.relu(torch.mm(self.nodevec1_c, self.nodevec2_c))
d_c = 1 / (torch.sum(A_cluster, -1))
D_c = torch.diag_embed(d_c)
A_cluster = torch.matmul(D_c, A_cluster)
new_supports_cluster = self.supports_cluster + [A_cluster]

# 定义卷积块
self.block_cluster1 = GCNPool(dilation_channels, dilation_channels, cluster_nodes, length - 6, 3, dropout,
                              cluster_nodes,
                              self.supports_len)

# 卷积
x_cluster = self.block_cluster1(x_cluster, new_supports_cluster)

3 道路网络图上的 GCN(GCN on the Graph of Road Network

道路网络图上的 GCN 和区域图上的 GCN 算法基本相同,只不过输入数据从区域图变成了道路节点图,也就是最传统的卷积方式。


4 宏观图和微观图之间的交互层(Interaction Layer between Macro and Micro Graphs)

如上图所示, 在区域图和道路网之间存在一个动态传递模块(Dynamic Transfer Block),用于融合区域特征与道路段特征。

首先,构造一个传递函数 Tran 。对于道路节点 i 与区域 j 的对应关系,如果节点 i 属于区域 j,则将区域 j 的特征复制并与道路段 i 的特征级联。

因为交通数据具有动态变化的特性,道路段与区域之间的关系也应随之变化。因此作者采用了注意力机制优化传递函数。其中 为注意力分数,减去均值有助于消除不同特征维度间数值分布的偏差,使后续计算更稳定。

python 复制代码
# 道路网络特征
c1 = seq  
f1 = self.conv1(c1).squeeze(1)#b,n,l

# 区域特征
c2 = seq_cluster.permute(0,3,1,2)#b,c,n,l->b,l,n,c
f2 = self.conv2(c2).squeeze(1)#b,c,n

logits=torch.sigmoid(torch.matmul(torch.matmul(f1,self.w),f2)+self.b)
a = torch.mean(logits, 1, True)
logits = logits - a
logits = torch.sigmoid(logits)

coefs = (logits)*self.transmit

最后,按照上述方法进行特征传递。设道路特征为 ,区域特征为

python 复制代码
x = self.start_conv(x)  # 道路网特征张量
x_cluster = self.start_conv_cluster(x_cluster)  # 区域图特征张量
transmit1 = self.transmit1(x, x_cluster)
x_1 = (torch.einsum('bmn,bcnl->bcml', transmit1, x_cluster))
x = self.gate1(x, x_1)

5 交通预测块(Traffic Forecasting Block)

为从不同阶段的特征中提取更多信息,设计了跳跃连接(skip-connection)来汇聚上一步得到的两个不同特征,然后将汇聚结果输入预测模块。对比其他论文使用的残差网络(Res Net),残差连接的过程中加法操作是固定的,总是把原始信息无条件地加回来。而本篇论文使用的跳跃连接 + 动态传递模块则好比是一条"智能通道",不仅传递原始信息,还会根据当前情况自动调节信息的"强度"。如果某部分信息更关键,它就会给它更大的权重;如果不那么重要,就会弱化它。

python 复制代码
self.skip_conv1 = Conv2d(2 * dilation_channels, skip_channels, kernel_size=(1, 1), stride=(1, 1), bias=True)
self.end_conv_1 = nn.Conv2d(in_channels=skip_channels, out_channels=end_channels, kernel_size=(1, 3), bias=True)
self.end_conv_2 = nn.Conv2d(in_channels=end_channels, out_channels=out_dim, kernel_size=(1, 1), bias=True)

s1 = self.skip_conv1(x)
skip = s1 + skip

# output
x = F.relu(skip)
x = F.relu(self.end_conv_1(x))
x = self.end_conv_2(x)
相关推荐
是枚小菜鸡儿吖4 分钟前
卷不动了?带你拆解 2026 深度学习核心版图:CNN、Transformer 与扩散模型的实战进化
深度学习·cnn·transformer
泯泷5 分钟前
当AI排行榜成为一场数字游戏
人工智能·产品
神一样的老师5 分钟前
【RT-Thread Titan Board 开发板】家庭AI相框
人工智能
靴子学长19 分钟前
Decoder only 架构下 - KV cache 的理解
pytorch·深度学习·算法·大模型·kv
智算菩萨19 分钟前
【OpenGL】10 完整游戏开发实战:基于OpenGL的2D/3D游戏框架、物理引擎集成与AI辅助编程指南
人工智能·python·游戏·3d·矩阵·pygame·opengl
刘简爱学习30 分钟前
弱监督互斥多类脑肿瘤图像分割的类间可分离性损失
人工智能·深度学习·计算机视觉
AI英德西牛仔36 分钟前
AI复制的文字带星号
人工智能·ai·chatgpt·豆包·deepseek·ds随心转
卖报的大地主41 分钟前
扩散薛定谔桥(Diffusion Schrödinger Bridge)
人工智能
向成科技44 分钟前
当“超轻量AI”遇上“最强国产芯”
人工智能·物联网·ai·芯片·国产化·硬件·主板
远见阁1 小时前
智能体是如何“思考”的:ReAct模式
人工智能·ai·ai智能体