论文笔记:Large Language Models are Zero-Shot Next LocationPredictors

1 intro

  • 下一个地点预测(NL)包括基于个体历史访问位置来预测其未来的位置。
    • NL对于应对各种社会挑战至关重要,包括交通管理和优化、疾病传播控制以及灾害响应管理
  • NL 问题已经通过使用马尔可夫模型、基于模式的方法以及最近的深度学习(DL)技术(进行了处理。
    • 然而,这些方法并不具备地理转移能力
    • 因此,一旦这些模型在某个地理区域训练完毕,如果部署到不同的地理区域,它们将面临严重的性能下降
    • 尽管已经做出努力改善地理转移性,但主要的进展还是与集体移动模式相关,而零样本的地理独立性仍未得到解决
  • 此外,已经显示出大型语言模型(LLMs)嵌入了空间和地理知识,并且这些知识可以被有效提取
  • ------>探索将 LLMs 作为零样本下一个地点预测器的使用
    • 评估了四个 LLMs 的性能:Llama2、Llama2 Chat、GPT-3.5和 Mistral
    • 同时讨论了其他一些 LLMs、Phi-2、Phi-3、Gemma、GPT-J、Dolly的一些限制

2 preliminary

2.1 任务定义

  • 下一个地点预测通常定义为根据个体的历史移动轨迹预测其下一个将访问的地点的问题,这些轨迹通常表示为时空轨迹
    • (轨迹)时空点 p = (t, l) 是一个元组,其中 t 表示时间戳,l 表示地理位置。轨迹 P = p1, p2, ..., pn 是个体访问的 n 个时空点的时间有序序列
      • 根据 DeepMove的方法筛选轨迹
        • 筛选出记录少于 10 条的用户
        • 选择了 72 小时的间隔作为区分不同轨迹的阈值
        • 任何拥有少于五条轨迹的用户都被排除在分析之外
    • 用户的每条轨迹 P 都由历史访问H(history)和情境C(context)访问组成

2.2 数据集

  • 利用了在 Foursquare 上收集的两个数据集,纽约和东京
    • 每个条目包括用户标识符、位置标识符、地理坐标、时间戳和场所类别
    • 还使用了一个私人数据集来缓解潜在的数据污染问题。它由意大利费拉拉的自行车手产生的 GPS 轨迹组成
      • 将城市划分为 200 x 200 平方米,并最终得到 2,488 个独特的位置

2.3 衡量标准

3 模型

4 实验

4.1 传统模型不具备迁移性

4.2 大模型的zero-shot和few-shot 能力不错

4.3 H和C的影响

增加 C 或 H 的访问次数无论是哪种模型,都会在 ACC@5 方面带来改进

完全去除情境或历史信息的极端情况导致性能严重下降

相关推荐
Q8343158192 分钟前
海思SD3403(21AP10, 108DC2910 )4K60 的 ISP 图像处理能力,4Tops INT8算力
linux·图像处理·人工智能·嵌入式硬件·视觉检测·视频编解码
机器不会学习CL8 分钟前
分类预测|基于麻雀优化支持向量机的Adaboost集成的数据分类预测Matlab程序SSA-SVM-Adaboost
人工智能·算法·机器学习·支持向量机·matlab·分类
科技资讯快报27 分钟前
容联云容犀Copilot&Agent入选《中国 AI Agent 产品罗盘》
大数据·人工智能·copilot
爱研究的小牛39 分钟前
ESRGAN——老旧照片、视频帧的修复和增强,提高图像的分辨率
人工智能·深度学习·自动化·aigc·音视频
ClonBrowser1 小时前
社交媒体的未来:Facebook如何通过AI技术引领潮流
人工智能·媒体·facebook
chiikawa&q1 小时前
(不用互三)解密AI创作:提升Prompt提示词的提问技巧
人工智能·prompt
E___V___E1 小时前
yolov1到yolov5的发展
人工智能·yolo·目标跟踪
tangjunjun-owen1 小时前
kitti数据label的2d与3d坐标转为像素坐标方法与教程(代码实现)
人工智能·opencv·3d·3d目标检测·kitti·内参
使者大牙1 小时前
深度学习中的常用线性代数知识汇总——第一篇:基础概念、秩、奇异值
人工智能·pytorch·python·深度学习·线性代数
猿类崛起@2 小时前
OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准
人工智能·深度学习·ai大模型·大模型学习·大模型入门·大模型教程