论文笔记:Instruction-Tuning Llama-3-8B Excels in City-Scale MobilityPrediction

2024 Sigspatial Hummob Workshop 第2/3名

  • 提出了 Llama-3-8B-Mob------一个基于 Llama-3-8B的指令微调版本,专为长期、多城市人类移动预测而设计。

1 问题定义

2 方法

  • 将轨迹预测问题重构为一个带有指令的问答任务
    • 通过 GPT-3.5 和 4 进行实验,发现虽然该问答框架能在零样本情况下得到可接受结果,但仍存在准确性差、API 成本高、数据泄露风险等问题。
    • ------>使用 LoRA对 Llama-3-8B 进行了指令微调,仅微调注意力层和投影,提升效率

3 结果

尽管 Llama-3-8B-Mob 预测效果强,但其训练和推理成本也显著高于 LP-Bert

相关推荐
UQI-LIUWJ2 小时前
论文笔记:Tuning Language Models by Proxy
论文阅读·人工智能·语言模型
钟屿1 天前
Multiscale Structure Guided Diffusion for Image Deblurring 论文阅读
论文阅读·图像处理·人工智能·深度学习·计算机视觉
张较瘦_1 天前
[论文阅读] 人工智能 + 软件工程 | NoCode-bench:评估LLM无代码功能添加能力的新基准
论文阅读·人工智能·软件工程
莫彩2 天前
【大模型论文阅读】2503.01821_On the Power of Context-Enhanced Learning in LLMs
论文阅读·人工智能·语言模型
王上上2 天前
【论文阅读51】-CNN-LSTM-安全系数和失效概率预测
论文阅读·cnn·lstm
有Li2 天前
弹性网:基于神经网络的多组分磁共振弹性成像波反演与不确定性量化|文献速递-医学影像算法文献分享
论文阅读·医学生
妙BOOK言2 天前
FalconFS: Distributed File System for Large-Scale Deep Learning Pipeline——论文阅读
论文阅读·元数据·分布式文件系统
2301_803652742 天前
PPO原论文阅读
论文阅读
北京地铁1号线3 天前
YOLO12论文阅读:Attention-Centric Real-Time Object Detectors
论文阅读·yolo·目标检测
张较瘦_3 天前
[论文阅读] 人工智能 + 软件工程 | 从OpenAPI到MCP服务器:AutoMCP如何让LLM工具集成自动化?
服务器·论文阅读·人工智能