HGCN论文阅读

HGCN结构

本篇论文解决交通预测问题共分为五个部分,分别是谱聚类(Spectral Clustering)、区域图山的GCN(GCN on the Graph of Regions)、道路网络图山的GCN(GCN on the Graph of Road Network)、宏观图和微观图之间的交互层(Interaction Layer between Macro and Micro Graphs)、交通预测块(Traffic Forecasting Block)。

1 生成交通层次图(Spectral Clustering)

1.1 构建微观道路网络图

所谓 "微观" ,就是道路图上节点的交通数据(如速度、流量或密度)。

1.2 构建宏观区域图

所谓 "宏观区域" ,就是指把之前的微观节点聚类为一个区域。本文采用谱聚类方法,对道路网络图进行处理,从而构建区域的宏观图。如上图所示,一共分为4步:

  1. 获取邻接矩阵:首先从道路网络图中获得邻接矩阵。
  2. 谱聚类:对邻接矩阵的拉普拉斯矩阵进行谱聚类,将整个道路网络划分为若干簇。每个簇即视作区域图中的一个宏观节点。
  3. 区域特征计算:每个宏观节点(4个小点儿)的特征由该簇内所有微观节点特征的均值和最小值组合而成。
  4. 构造宏观图边:基于微观图构造宏观图。

2 区域图上的GCN(GCN on the Graph of Regions)

针对第一步中产生的基于区域的宏观图(Region Data),先来一个线性变换(Linear Transformation)对其进行初步转换。 其主要目的是将输入数据投影到一个新的特征空间,以便后续的图卷积操作能够更有效地学习数据表示。

python 复制代码
# 线性变换:将 in_dim(1) 维度转换为 residual_channels(32) 维度
self.start_conv_cluster = nn.Conv2d(in_channels=in_dim_cluster,
                                    out_channels=residual_channels,
                                    kernel_size=(1, 1))

input_c = input_cluster
x_cluster = self.bn_cluster(input_c)
x_cluster = self.start_conv_cluster(x_cluster)  # 关于区域图的特征张量

接下来,是连续的两次时空图卷积(S-T Block)。在第一个时空卷积块(S-T Block)中,采用一个较小的卷积核,感受野增长很慢,模型主要处理一些最近的数据。比如:突发事件、红绿灯导致的交通波动、局部区域的流量变化。

在第二个时空卷积块中,它的输入已经包含了过去几个时间步的汇总信息,因此可以处理处理更长时间范围的数据。比如:上下班高峰、天气影响、节假日模式。

python 复制代码
# 计算区域图的邻接矩阵 new_supports_cluster 
A_cluster = F.relu(torch.mm(self.nodevec1_c, self.nodevec2_c))
d_c = 1 / (torch.sum(A_cluster, -1))
D_c = torch.diag_embed(d_c)
A_cluster = torch.matmul(D_c, A_cluster)
new_supports_cluster = self.supports_cluster + [A_cluster]

# 定义卷积块
self.block_cluster1 = GCNPool(dilation_channels, dilation_channels, cluster_nodes, length - 6, 3, dropout,
                              cluster_nodes,
                              self.supports_len)

# 卷积
x_cluster = self.block_cluster1(x_cluster, new_supports_cluster)

3 道路网络图上的 GCN(GCN on the Graph of Road Network

道路网络图上的 GCN 和区域图上的 GCN 算法基本相同,只不过输入数据从区域图变成了道路节点图,也就是最传统的卷积方式。


4 宏观图和微观图之间的交互层(Interaction Layer between Macro and Micro Graphs)

如上图所示, 在区域图和道路网之间存在一个动态传递模块(Dynamic Transfer Block),用于融合区域特征与道路段特征。

首先,构造一个传递函数 Tran 。对于道路节点 i 与区域 j 的对应关系,如果节点 i 属于区域 j,则将区域 j 的特征复制并与道路段 i 的特征级联。

因为交通数据具有动态变化的特性,道路段与区域之间的关系也应随之变化。因此作者采用了注意力机制优化传递函数。其中 为注意力分数,减去均值有助于消除不同特征维度间数值分布的偏差,使后续计算更稳定。

python 复制代码
# 道路网络特征
c1 = seq  
f1 = self.conv1(c1).squeeze(1)#b,n,l

# 区域特征
c2 = seq_cluster.permute(0,3,1,2)#b,c,n,l->b,l,n,c
f2 = self.conv2(c2).squeeze(1)#b,c,n

logits=torch.sigmoid(torch.matmul(torch.matmul(f1,self.w),f2)+self.b)
a = torch.mean(logits, 1, True)
logits = logits - a
logits = torch.sigmoid(logits)

coefs = (logits)*self.transmit

最后,按照上述方法进行特征传递。设道路特征为 ,区域特征为

python 复制代码
x = self.start_conv(x)  # 道路网特征张量
x_cluster = self.start_conv_cluster(x_cluster)  # 区域图特征张量
transmit1 = self.transmit1(x, x_cluster)
x_1 = (torch.einsum('bmn,bcnl->bcml', transmit1, x_cluster))
x = self.gate1(x, x_1)

5 交通预测块(Traffic Forecasting Block)

为从不同阶段的特征中提取更多信息,设计了跳跃连接(skip-connection)来汇聚上一步得到的两个不同特征,然后将汇聚结果输入预测模块。对比其他论文使用的残差网络(Res Net),残差连接的过程中加法操作是固定的,总是把原始信息无条件地加回来。而本篇论文使用的跳跃连接 + 动态传递模块则好比是一条"智能通道",不仅传递原始信息,还会根据当前情况自动调节信息的"强度"。如果某部分信息更关键,它就会给它更大的权重;如果不那么重要,就会弱化它。

python 复制代码
self.skip_conv1 = Conv2d(2 * dilation_channels, skip_channels, kernel_size=(1, 1), stride=(1, 1), bias=True)
self.end_conv_1 = nn.Conv2d(in_channels=skip_channels, out_channels=end_channels, kernel_size=(1, 3), bias=True)
self.end_conv_2 = nn.Conv2d(in_channels=end_channels, out_channels=out_dim, kernel_size=(1, 1), bias=True)

s1 = self.skip_conv1(x)
skip = s1 + skip

# output
x = F.relu(skip)
x = F.relu(self.end_conv_1(x))
x = self.end_conv_2(x)
相关推荐
给自己做减法几秒前
AI编程相关概念
人工智能·python·ai编程
实在智能RPA5 分钟前
Agent 的流程可以随时修改调整吗?深度解析 2026 年智能体动态编排与业务闭环
人工智能·ai
郝学胜-神的一滴8 分钟前
PyTorch自动微分核心解析:从原理到实战实现权重更新
人工智能·pytorch·python·深度学习·算法·机器学习
小龙报9 分钟前
【Coze-AI智能体平台】Coze OpenAPI 开发手册:鉴权、接口调用与 SDK 实践
javascript·人工智能·python·深度学习·microsoft·文心一言·开源软件
科技苑9 分钟前
告别付费枷锁:在家电脑自建大模型,Token自由不是梦
人工智能·时序数据库
TDengine (老段)12 分钟前
TDengine IDMP 可视化 —— 饼图
大数据·数据库·人工智能·物联网·时序数据库·tdengine·涛思数据
Flying pigs~~17 分钟前
从“踩坑”到“可控”:大模型 Prompt 工程实战总结与进阶方法论
大数据·人工智能·大模型·prompt·提示词工程
safestar201224 分钟前
Agent系统架构中的「注意力聚焦模式」:从理论到工程实践
人工智能·ai·系统架构·ai编程
星马梦缘29 分钟前
rl库 AttributeError: ‘bool‘ object has no attribute ‘items‘ 的解决方案
人工智能·深度学习·机器学习·强化学习
China_Yanhy30 分钟前
Gemini said动手学大模型第二篇学习总结:从“调参”到“调教”
人工智能