论文笔记：Seed: Bridging Sequence and Diffusion Models for RoadTrajectory Generation

WWW 2025

1 INTRO

随着 GPS 设备的普及，车辆和个体的移动轨迹可以轻松被记录为轨迹数据
- 大量的轨迹数据促进了许多重要应用的发展，例如城市交通规划、车辆导航和路径推荐
- 然而，获取真实世界的轨迹数据面临多种挑战，包括高昂的数据采集成本、隐私问题，以及商业限制
- 轨迹生成技术通过基于参考轨迹数据集生成合成但真实感强的轨迹，从而成为应对上述挑战的有效方案
为了服务下游任务，合成轨迹需具备以下特性：
- 应与参考轨迹相似（即一致性）、遵循轨迹运动规律]，并且在生成的多个轨迹之间具有差异性（即多样性）
现有轨迹生成方法根据方法论可分为两类：
- 递归式方法（Recurrent）
  -  使用序列模型（ LSTM 和 Transformer）以自回归的方式逐段生成轨迹（即一次一个道路段）
    - SeqGAN 结合了 LSTM 和生成对抗网络（GAN），并使用策略梯度算法进行训练。
    - TrajVAE 利用 LSTM 和变分自编码器（VAE）学习轨迹表示并重构轨迹。
    - TS-TrajGen 则结合 Transformer 和两个 GAN，以由粗到细的粒度生成每条轨迹。
- 整体式方法（Holistic）
  -  一次性生成完整的轨迹
    - TrajGAN使用基于卷积神经网络（CNN）的 GAN 生成虚拟的轨迹图像，再将其转化为轨迹
    - 为了利用扩散模型,DiffTraj和Diff-RNTraj将扩散模型分别集成到 U-Net $31$ 和 WaveNet $18$ 中进行轨迹生成。

递归方法在一致性和规律性方面表现出色，这是因为序列模型擅长捕捉参考轨迹沿道路段的运动模式
- 然而，它们的多样性较差，因为生成的轨迹常常严格遵循同一运动模式，导致生成轨迹相似
相反地，那些基于扩散模型的整体式方法具有较高的多样性，但一致性和规律性较弱
- 这是因为扩散模型是从随机噪声中恢复轨迹，不同运行中生成的轨迹往往不同，但它们无法很好地捕捉沿道路段的顺序移动模式
------>论文提出了一种名为 Seed 的轨迹生成方法，目标是同时实现一致性、规律性和多样性
- 核心思想是联合使用序列模型和扩散模型，兼顾两者优点，同时避免其缺陷