本文分享了一篇2026年智能交通顶级期刊IEEE Transactions on Intelligent Transportation Systems(TITS)接收的论文《Emergency Events Traffic Flow Forecasting Using Text-Prompt-Guided Multimodal Large Language Models》。该论文针对城市交通中突发事件导致常规预测模型失效的痛点,提出了一种名为TPGM-LLM的预测框架。该框架通过大语言模型将突发事件的文本描述转化为语义提示,并与动态时空超图结合,实现了文本引导与交通流动态的深度融合。实验结果显示,在真实的多模态文本-交通数据集(BjTT)上,TPGM-LLM优于对比的基线模型。这一成果为事件下的智能交通管理和实时决策提供了强有力的技术支撑。
代码链接:https://github.com/luyaxuan/TPGM-LLM
论文链接:https://ieeexplore.ieee.org/document/11442944
本推文作者为韩煦,审校为邓镝。
一、研究背景
城市环路上原本畅通的车流可能会因为突发的交通事故瞬间化为止步不前的长龙,这种由于交通事故、自然灾害、基础设施故障等引发的突发事件,会严重破坏城市路网中正常的交通流状态。图1生动地展示了交通状况的延迟扩散特性。传统的交通流预测方法往往重度依赖历史交通数据和周期性的出行需求模式,面对这种突如其来的拥堵显得力不从心。近年来,虽然有研究开始尝试引入社交媒体或新闻报道中的文本信息来辅助预测,但这些方法大多停留在浅层语义集成的阶段。它们通常只是将文本作为静态的辅助特征,未能将文本中的语义上下文与城市交通流的时空模式进行有效的对齐和联合建模。例如某些模型依赖提取的关键词频率,无法捕获事件描述背后深层的语义上下文,导致语义特征与路网动态的时空演变脱节。
此外,传统基于图卷积的方法在处理非直接空间关联时存在局限性。而现有的大语言模型(LLM)虽然在处理文本方面表现优异,但在提取深层时间模式以及将多源异构数据进行语义对齐时仍面临困难。因此,如何构建一个能同时学习空间、时间以及语义关系,并在突发事件下进行高精度长期预测的框架,成为了突破现有交通预测瓶颈的关键所在。

图1 交通状况的延迟扩散特性
二、研究方法
在研究方法上,该论文提出的TPGM-LLM主要由4个核心模块组成,分别对应突发事件语义建模、时间规律建模、空间结构建模以及多模态融合预测。

图2 TPGM-LLM 框架结构图
2.1 突发事件文本提示编码模块
如图2左下所示,该模块的核心作用,是把原本难以直接用于预测的自然语言事件描述,转化为可计算的语义提示。具体来说,模型利用预训练语言模型BERT,对交通事故、道路施工、道路封闭、恶劣天气等事件文本进行编码,将事件类型、发生位置、影响范围和严重程度等信息映射为高维语义嵌入。相比传统方法只把文本当作简单的辅助标签或关键词统计特征,这一模块能够更深入地理解事件本身的语义含义,使模型在面对突发扰动时,不再是机械依赖历史交通流变化,而是能够结合发生了什么事,发生在哪里来动态调整预测结果。
2.2 周期性时间嵌入模块
交通流具有明显的多尺度周期规律,相邻时间片之间的连续演化关系。例如早晚高峰、工作日与周末差异。为此,论文专门设计了时间嵌入模块,从小时级、星期级以及连续时间步三个层面提取时间特征。模型一方面通过小时位置编码和星期位置编码来刻画交通在日内和周内的周期性波动,另一方面通过时间步卷积去建模相邻时刻之间的短期依赖关系。最终,这些不同粒度的时间信息被统一融合为完整的时间提示表示。这样的设计使模型不仅能识别长期存在的出行规律,也能更敏感地捕捉突发事件发生前后交通状态的动态变化,从而提升对未来交通演变的刻画能力。
2.3 时空超图嵌入模块
时空超图嵌入是该论文在空间建模上的重要创新。传统交通预测大多基于静态路网图,只考虑道路之间的物理邻接关系,但在现实中,交通扰动的传播往往并不局限于地理上直接相邻的路段。为了解决这一问题,模型首先利用FastDTW算法衡量不同路段交通流时间序列之间的相似性,再据此动态构建时空超图。那些虽然不直接相连、但在拥堵扩散、事故传播、绕行分流中表现出相似变化趋势的路段,也能够被联系起来。随后,模型通过归一化超图卷积进一步提取高阶结构特征,从而捕捉传统静态图难以描述的非局部依赖关系。可以理解为,这个模块让模型看到的不只是哪些路挨着,更多的是哪些路会一起受影响。
2.3 用于突发事件预测的 LLM
这是整个框架中负责深度融合与最终预测的核心模块。在前面三个模块分别得到文本语义特征、时间嵌入特征和时空超图特征之后,模型先通过特征融合卷积(FConv)将三类信息拼接整合,形成统一的多模态表示,再输入到基于Transformer的MFE-LLM中进行进一步建模。该模块采用了部分冻结的训练策略:浅层参数保持冻结,以保留预训练模型原有的通用序列建模能力;深层多头注意力机制则保持可训练,使模型能够针对交通预测任务学习更具针对性的时空交互模式。最终,模型将提取到的深层特征送入回归层,输出未来多个时间步的交通流预测值。总而言之,这一模块不仅完成了多模态信息的融合,还承担了把事件语义、时间规律、空间传播统一转化为预测结果的任务,是实现长期预测和复杂场景鲁棒预测的关键。
三、实验
为了全面验证TPGM-LLM的有效性与泛化能力,研究团队在大型公开多模态文本-交通数据集(BjTT)上开展了系统性实验。该数据集包含了超过32000条时间序列记录以及覆盖北京五环内1260条主要道路的事件文本描述。实验对比了包括DCRNN、STGCN、GWN、GMAN、DGCRN、AGCRN、GATGPT、GCNGPT等多种代表性方法。
3.1 与基线模型的性能对比
如表1所示,TPGM-LLM在2022年1月、2月、3月三个月的测试中都取得了最优结果。以1月为例,模型在MAE、RMSE、MAPE、WAPE四项指标上分别达到3.20、4.82、7.27%、5.47%。论文指出,相比当月表现最好的基线模型GMAN,TPGM-LLM的MAE提升16.0%,RMSE提升20.2%,MAPE提升24.7%,WAPE提升20.3%。2月和3月中,TPGM-LLM也分别取得MAE 3.17/3.22、RMSE 4.80/4.90、MAPE 6.75%/7.29%、WAPE 5.53%/5.75%的最好成绩,说明该模型在跨月份与多场景条件下都具有稳定优势。
表1 不同模型在多个数据集上的性能对比

3.2 特殊时段性能分析
在高峰时段预测能力方面,作者专门选取工作日7:00--9:00和17:00--20:00的高波动交通时段,分别预测未来5、10、15个时间步。如表2所示,TPGM-LLM在三个预测跨度下依然显著优于所有对比方法,其MAE分别为3.02、2.84、2.62,RMSE分别为4.73、4.46、4.17。论文特别指出,一个很有意思的现象是:随着预测步长增加,其他模型误差普遍升高,而TPGM-LLM的误差反而呈下降趋势。作者认为,这与突发事件对交通流存在延迟扩散效应有关------例如事故发生后,拥堵往往在大约40分钟左右达到最严重状态,因此文本事件信息能够帮助模型更早捕捉这种滞后影响,从而在更长预测跨度上体现出更明显优势。
表2 TPGM-LLM 在早晚高峰时的性能对比

3.3 消融实验与可视化分析
在本实验节中,论文进一步证明了各模块设计的必要性。表3提供了具体的消融数据。去掉突发事件文本提示模块后,模型性能下降最明显,说明文本语义对于识别事故、封路、施工等非常规扰动至关重要;去掉时空超图模块或去掉MFE-LLM后,预测精度也都会明显下降,表明非局部结构依赖建模和多模态深层特征提取同样不可缺少。与此同时,在多模态融合策略对比中,该论文提出的FConv也优于cross-attention和gated fusion,在1月数据上取得MAE 3.20、RMSE 4.82、MAPE 7.27%、WAPE 5.47%的最佳结果。
表3 TPGM-LLM框架的消融实验结果

如图3所示,在图构建策略比较中,基于DTW的超图结构优于仅基于地理邻接或地理+时间混合图,说明突发事件下交通传播更依赖"时间演化相似性"而不仅仅是物理相邻关系。可视化结果还表明,该模型不仅能较好拟合1小时和6小时预测,还能在1天甚至7天的长时距预测中保持对整体交通趋势和局部异常区域的较强刻画能力。

图3 交通流量预测结果可视化。第二列和第四列展示了 TPGM ‑LLM 模型对1 小时、6 小时、1 天和 7 天的预测结果,第一列和第三列则为对应的真实值。颜色从绿色(交通畅通)渐变至红色(严重拥堵)。
四、总结
论文提出了一种文本提示引导的多模态大语言模型TPGM-LLM,为解决事件下的交通流预测难题提供了崭新的思路。通过将预训练LLM提取的事件语义、基于FastDTW的动态时空超图以及分层多模态特征融合机制进行深度融合,模型成功跨越了文本上下文与复杂交通动态之间的语义鸿沟。实验结果证明了该框架在处理高峰期扰动和长期预测任务上的卓越性能,为真实世界中智能交通系统的应急响应和实时管理提供了有效的解决方案。