面向高效与证据驱动的个体移动预测 (AgentMob)

面向高效与证据驱动的个体移动预测 (AgentMob)

论文来源 : arXiv:2606.05130 | 主题: 个体移动预测、大语言模型推理、自适应工具调用、免训练 (Training-Free)


📌 摘要与核心贡献

传统个体移动预测主要面临两个瓶颈:监督模型虽然准确率高,但需要昂贵的任务特定训练且缺乏决策透明度;现有的静态 LLM 方法虽然提升了可解释性,但依赖固定提示词且仅进行单遍推理,在移动信号微弱或冲突时无法主动搜索额外证据。

本文提出 AgentMob ,一种基于大语言模型(LLM)的无训练框架,将位置预测转化为自适应证据控制的决策过程。AgentMob 中的 LLM 充当控制器,根据预测难度动态分配推理资源。

🌟 核心贡献

  1. 自适应工具调用框架:提出 AgentMob,实现基于历史规律(Fast Path)和基于证据探索(Adaptive Tool-Calling)的双层预测管道。
  2. 移动分析工具箱 (Mobility Analysis Toolbox):设计了多种工具,包括上下文检索器、地理信息检索器、停留-移动估计器及历史行为检索器,实现证据的交叉验证。
  3. 性能与效率:在多个基准测试中,AgentMob 实现了免训练方法的最优性能,并在上海 ISP 数据集上将令牌使用量降低了 94.1%,有效避免了传统 Prompt 方法的"空间漂移"问题。
  4. 理论发现:证明了基于控制器的决策在消除空间漂移和提高预测准确率上的显著优势。

1. 核心架构与方法论

1.1 双层预测管道

AgentMob 采用以下两步策略处理不同难度的预测场景:

  • 快速路径 (Fast Path):利用历史规律(如同个工作日/小时的最高概率停留点)瞬间解决常规情况,避免大模型调用。
  • 自适应工具调用 (Adaptive Tool-Calling):对于模糊情况(如历史数据稀疏或信号冲突),LLM 控制器迭代调用工具库(最多 10 次迭代),收集并交叉验证证据以做出最终决策。

1.2 移动分析工具箱

工具名称 功能描述
Mobility Context Retriever 总结最近轨迹上下文及相同时段的历史访问统计
Geographical Information Retriever 提供候选位置的距离及城市功能的文本描述
Stay--Move Estimator 比较当前停留时长与历史统计数据,预测移动的可能性
Historical Behavior Retriever 检索过去在类似时间上下文下的访问记录(停留时间、转移模式)
Location Profiler (可选) 验证工具,检查候选位置的合理性及语义一致性

可审计性 (Auditability):每一次预测都会记录用户 ID、时间戳、允许的历史范围、调用的工具、序列化输出、LLM 推理步骤以及排名预测。


2. 实验评估与结果

2.1 数据集与性能对比

实验在三种不同空间粒度的移动数据集上进行,评估了 AgentMob (GPT-5.4) 的性能:

数据集 描述 AgentMob (GPT-5.4) 表现 (Acc@1 / MRR@5)
BW (Tokyo GPS) 东京 GPS 轨迹 (管理多边形) 71.42% / 78.84%
YJMob100K 匿名化 500m 网格 33.14% / 46.55%
Shanghai ISP 移动网络日志 33.50% / 47.44%

关键发现

  • 免训练最强性能:在所有骨干模型下,AgentMob 均取得了当前无训练 LLM 方法的最优性能。
  • 控制器驱动的增益 :在非快速路径情况下,LLM 控制器将确定性统计基线的准确率从 30.65% 提升至 48.62%
  • 空间精度提升:AgentMob 有效避免了基于提示词方法中常见的"空间漂移"现象,尤其在较密集的网格设置下表现优异。

2.2 效率与消融实验

移除的工具 对性能的影响
Stay--Move Estimator 性能一致减弱;在近期连续性与出发模式发生冲突的边界情况下至关重要
Historical Behavior Retriever 空间锚定关键组件;防止密集网格设置下产生远端预测
Mobility Context Retriever 帮助避免对稀疏的"工作日-小时"模式过度反应
Location Profiler 可选组件,对模糊情况有价值;在覆盖决策前验证候选合理性

3. 效率与成本分析

  • 自适应计算:常规案例通过快速路径退出;模糊案例通过有针对性的工具调用进行解决。
  • 令牌削减 :在上海 ISP 数据集上,AgentMob 通过将长历史提示替换为紧凑的结构化证据,将令牌使用量减少了 94.1%
  • 执行速度:尽管使用了迭代式工具调用,但由于并行执行 Worker 和快速路径占主导地位,AgentOB 的整体耗时反而低于传统基线。

4. 局限性与未来方向

  1. LLM 依赖:效果依赖于大模型的指令遵循能力,较小模型可能需要更严格的工具验证或蒸馏。
  2. 数据范围:目前在被动感知的轨迹(GPS/移动网络)上进行了评估;尚未在主动签到数据集(如 Foursquare)上测试。
  3. 工具设计:当前的边界和调用策略是手动指定的,未来将探索自动提示调优、学习的工具选择策略以及动态工具组合。
  4. 风险:随着 LLM 能力的提升,工具设计的实际效能可能会发生动态变化。
相关推荐
张彦峰ZYF1 小时前
深入 LangGraph State:Reducer 是如何让状态“自动合并”的
人工智能·python·大模型·langgraph
程序喵大人1 小时前
C++ 程序员转型 AI Infra 学习路线
c++·人工智能·学习·ai infra
陈天伟教授1 小时前
图解人工智能(45)人工智能应用-语音识别
人工智能·语音识别
白狐_7981 小时前
AI 数据分析 Skill 实战:用模拟游客数据生成文旅运营报告
大数据·服务器·人工智能
数学建模导师1 小时前
【AI生成内容的质量评估】2026中青杯B题26页成品论文重磅更新
人工智能·深度学习·机器学习
comcoo1 小时前
Windows 部署龙虾 AI OpenClaw,快速构建本地私有化 AI 智能体
人工智能·github·开源软件·open claw·open claw部署
段一凡-华北理工大学1 小时前
工业领域的Hadoop架构学习~系列文章13:数据湖架构 - 工业大数据的统一存储底座
大数据·人工智能·hadoop·分布式·架构·高炉炼铁·高炉智能化
俊哥V1 小时前
每日 AI 研究简报 · 2026-06-04
人工智能·ai