论文笔记:Seed: Bridging Sequence and Diffusion Models for RoadTrajectory Generation

WWW 2025

1 INTRO

  • 随着 GPS 设备的普及,车辆和个体的移动轨迹可以轻松被记录为轨迹数据
    • 大量的轨迹数据促进了许多重要应用的发展,例如城市交通规划、车辆导航和路径推荐
    • 然而,获取真实世界的轨迹数据面临多种挑战,包括高昂的数据采集成本、隐私问题 ,以及商业限制
    • 轨迹生成技术通过基于参考轨迹数据集生成合成但真实感强的轨迹,从而成为应对上述挑战的有效方案
  • 为了服务下游任务,合成轨迹需具备以下特性:
    • 应与参考轨迹相似(即一致性)、遵循轨迹运动规律],并且在生成的多个轨迹之间具有差异性(即多样性)
  • 现有轨迹生成方法根据方法论可分为两类:
    • 递归式方法(Recurrent)
      • ​​​​​​​ 使用序列模型( LSTM 和 Transformer)以自回归的方式逐段生成轨迹(即一次一个道路段)
        • SeqGAN 结合了 LSTM 和生成对抗网络(GAN),并使用策略梯度算法进行训练。
        • TrajVAE 利用 LSTM 和变分自编码器(VAE)学习轨迹表示并重构轨迹。
        • TS-TrajGen 则结合 Transformer 和两个 GAN,以由粗到细的粒度生成每条轨迹。
    • 整体式方法(Holistic)
      • ​​​​​​​ 一次性生成完整的轨迹
        • TrajGAN使用基于卷积神经网络(CNN)的 GAN 生成虚拟的轨迹图像,再将其转化为轨迹
        • 为了利用扩散模型,DiffTraj和Diff-RNTraj将扩散模型分别集成到 U-Net [31] 和 WaveNet [18] 中进行轨迹生成。
  • 递归方法在一致性和规律性方面表现出色,这是因为序列模型擅长捕捉参考轨迹沿道路段的运动模式

    • 然而,它们的多样性较差,因为生成的轨迹常常严格遵循同一运动模式,导致生成轨迹相似
  • 相反地,那些基于扩散模型的整体式方法具有较高的多样性,但一致性和规律性较弱

    • 这是因为扩散模型是从随机噪声中恢复轨迹,不同运行中生成的轨迹往往不同,但它们无法很好地捕捉沿道路段的顺序移动模式
  • ------>论文提出了一种名为 Seed 的轨迹生成方法,目标是同时实现一致性、规律性和多样性

    • 核心思想是联合使用序列模型和扩散模型,兼顾两者优点,同时避免其缺陷

2 问题定义

2.1 道路网络

2.2 道路轨迹

2.3 轨迹生成

3方法

Seed 包含三个主要组件:

  1. 一个道路段嵌入字典模块,用于将离散的道路轨迹转换为连续表示;

  2. 一个条件扩散模块,用于学习轨迹数据的分布,并以自回归方式生成道路轨迹;

  3. 一个课程学习模块,用于加速模型收敛并提升模型性能。

3.1 道路段嵌入

  • 一种简单的方法是使用一个随机道路段嵌入字典
    • 每个轨迹中的道路段均从该字典中提取
    • 然而,这种方法忽略了道路网络的拓扑结构以及用户的出行模式
  • ------>论文提出一种预训练策略,旨在学习一个更有效的道路段嵌入字典

3.2 条件扩散结构

3.2.1 扩散模型预备知识

  • 与标准扩散模型不同,标准模型处理的是整个轨迹表示,而本工作将扩散应用于每个道路段嵌入 ,并以自回归方式逐段生成轨迹,从而在保持序列性基础上提升生成多样性。扩散模型主要包括正向扩散过程反向去噪过程

3.2.2 引导条件

3.2.3 离散化与空间偏置

4.3 模型训练

4.4 课程学习

4.5 采样(Sampling)

需要在采样开始时指定要生成多少个道路段(比如 20 个),每步生成一个,生成满就停止。

5 实验

5.1 实验设置

5.1.1 数据集

  • 在三个广泛使用的真实世界数据集上评估 Seed 的性能,分别为:Porto¹、Shenzhen² 和 Chengdu³
  • 在每个数据集中,随机选取 80% 的轨迹作为训练集,剩余 20% 作为测试集

5.1.2 衡量指标

5.2主要结果

5.2.1 有效性分析

5.2.2 地理可视化分析

5.2.3 ablation study

相关推荐
张较瘦_3 小时前
[论文阅读] AI+ | GenAI重塑智慧图书馆:华东师大实践AI虚拟馆员,解放馆员聚焦高价值任务
论文阅读·人工智能
CoookeCola1 天前
MovieNet (paper) :推动电影理解研究的综合数据集与基准
数据库·论文阅读·人工智能·计算机视觉·视觉检测·database
张较瘦_2 天前
[论文阅读] AI+ | AI如何重塑审计行业?从“手工筛查”到“智能决策”:AI审计的核心逻辑与未来路径
论文阅读·人工智能
苦瓜汤补钙3 天前
论文阅读——Segment Anything(Meta AI)——SAM
论文阅读·图像处理·人工智能·nlp·ai编程
CV-杨帆3 天前
论文阅读:arxiv 2025 Safety in Large Reasoning Models: A Survey
论文阅读
张较瘦_3 天前
[论文阅读] AI | 大语言模型服务系统服务级目标和系统级指标优化研究
论文阅读·人工智能·语言模型
Vizio<3 天前
《基于电阻层析成像(ERT)的机器人皮肤空间灵敏度均衡:通过应变系数分布优化》ICRA 2025 论文解读
论文阅读·机器人·机器人触觉
三木今天学习了嘛4 天前
【VLA & Markov】VLA 架构和构建模块 与 Markov 带来的时序思考
论文阅读
依夏c4 天前
[论文笔记•(多智能体)]LLMs Can Simulate Standardized Patients via Agent Coevolution
论文阅读·论文笔记
wzx_Eleven4 天前
【论文阅读】AAAI 2025 | 面向精确分割式联邦学习的多模型聚合与知识重放
论文阅读·人工智能·机器学习