论文笔记:How Can Large Language Models Understand Spatial-Temporal Data?

arxiv 202401

1 intro

  • LLM在NLP和CV领域表现出色,但将它们应用于时空预测任务仍然面临挑战,主要问题包括:
    • 数据不匹配
      • 传统的LLMs设计用于处理序列文本数据,而时空数据具有复杂的结构和动态性,这两者之间存在显著差异
    • 模型设计限制
      • 现有的时空预测方法通常需要为特定领域设计专门的模型,这限制了模型的通用性和适应性
    • 数据稀缺和泛化能力
      • 传统的时空预测方法在面对数据稀缺或稀疏的情况下表现不佳,且泛化能力有限
    • ------>论文提出了STG-LLM(Spatial-Temporal Graph-Large Language Model)
      • STG-Tokenizer
        • 时空图(graph)标记器(Tokenizer)
        • 将复杂的图数据转换为简洁的tokens,这些token能够捕捉空间和时间关系
      • STG-Adapter
        • 轻量级的适配器,包含线性编码和解码层,用于在LLMs和token化数据之间架起桥梁
        • 通过微调少量参数,使LLMs能够理解由STG-Tokenizer生成的token的语义,同时保留LLMs原有的自然语言理解能力

2 LLM+时空的几种可能方法

3 论文方法

4 实验

4.1 supervised比较

4.2 few shot 迁移能力

4.3 ablation study

相关推荐
冬奇Lab4 小时前
OpenClaw 源码精读(3):Agent 执行引擎——AI 如何「思考」并与真实世界交互?
人工智能·aigc
没事勤琢磨5 小时前
如何让 OpenClaw 控制使用浏览器:让 AI 像真人一样操控你的浏览器
人工智能
用户5191495848455 小时前
CrushFTP 认证绕过漏洞利用工具 (CVE-2024-4040)
人工智能·aigc
牛马摆渡人5286 小时前
OpenClaw实战--Day1: 本地化
人工智能
前端小豆6 小时前
玩转 OpenClaw:打造你的私有 AI 助手网关
人工智能
BugShare6 小时前
写一个你自己的Agent Skills
人工智能·程序员
机器之心6 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai
后端小肥肠7 小时前
公众号躺更神器!OpenClaw+Claude Skill 实现自动读对标 + 写文 + 配图 + 存入草稿箱
人工智能·aigc·agent
爱可生开源社区8 小时前
SCALE | 重构 AI 时代数据库能力的全新评估标准
人工智能
Jahzo8 小时前
openclaw本地化部署体验与踩坑记录--飞书机器人配置
人工智能·开源