论文阅读：《A Universal Model for Human Mobility Prediction》

2301_797892832025-11-10 21:41

研究背景

人类移动预测目前主要聚焦于两块：个体轨迹预测和群体流动预测，所有相关研究目前都围绕这两大块中的一块进行，但没有人把这两块合起来一起研究，原因是因为这两类研究的数据格式差别过大，个人轨迹数据主要描述个体某个时间在某个位置，而群体流动数据主要记录某个位置某时间流入流出多少人，因此放在一起研究难度过大。

创新点

但是，这两种数据之间并不是毫无关联的，群体流动正是由个体轨迹聚合体现出来的，而个体行为又会受到群体的影响，因此放在一起研究很有必要。

为此，作者设计了一种新的框架，首次实现个体轨迹与人群流动预测的统一，解决了现有模型仅支持单任务的局限。该模型通过多视角移动令牌化器 将两种数据转换为统一时空令牌，结合扩散 Transformer 架构 建模时空动态，并设计双向个体 - 集体对齐机制（I2C 损失与 C2I 损失）提取共同时空模式，实现两者预测的相互增强。

问题定义

因为本文有两种输入数据，作者对这两种数据分别进行了阐述：

这段是比较好理解的，因此我就不过多说明了。问题定义就是：在我们知道过去一段时间（t-p到t这段时间）的个体轨迹数据或群体流动数据的情况下，预测未来k步之内的个人轨迹数据或群体流动数据。

模型框架

整个模型框架图也是比较清晰明白的。一共有五大块，接下来依次介绍这五大块的作用：

Multi-view Mobility Tokenizer

如图中所展示，输入数据有两块：个体轨迹、群体流动，在这个模块，输入数据由于格式不统一、原始数据太长等原因，需要对数据进行统一的切片处理，通过两个编码器（Trajectory Encoder和Flow Encoder）将不同的两种数据切片为长短一致的tokens，方便后续比较的操作。

Bidirectional Individual-Collective Alignment

这一步是两种损失的计算，也就是作者在创新点中说到的双向个体 - 集体对齐机制。

对于损失I2C来说，是一个个体轨迹向群体流动对齐的方式，具体实现是个体轨迹数据聚合起来，再通过相似度计算的公式与群体数据进行相似度计算，最终得到损失。

对于损失C2I来说，首先给出某地的群体数据峰值，这一峰值会有一个时间，那么将个体轨迹数据中此时此刻在此地的样本列为正样本，其余当作负样本，以此来计算对比损失使正样本越来越近负样本越来越远。

Diffusion Process

扩散过程用于给数据加噪声，记录下每一步t的噪声值，直到第T步，数据完全模糊。随机采样第t步的噪声与原数据结合，送入下一个环节。

Joint Noise Predictor

这个模块的输入是已经加了噪声的数据了。将两种数据合并在一起共同送入该模块，经过一个transformer预测出噪声，然后去噪。

Mobility Predictor

最后再将两种去噪后的数据分开，分别进行预测，得到预测损失L_pred。

损失函数

上述过程中产生了三个损失，将这三个损失按照一定比例相加，就可以得到完整的模型损失了：

上一篇：day61-devops

下一篇：SNN(TTFS)论文阅读——LC-TTFS

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 大模型 & AI 编程工具实战全总结 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10【AI前线观察】2026年国产开源大模型全面横评：从 DeepSeek V4 到 Kimi K3，谁才是开发者的最优选择？