LLM论文笔记 24: A Theory for Length Generalization in Learning to Reason

  • Arxiv日期:2024.7.29
  • 机构:University of Illinois Chicago

关键词

  • 长度泛化
  • 理论证明

核心结论

  • Theorem 3.1:因果函数的学习条件

    • 因果函数 f 是完全可学习的(输入空间有限、因果函数输入维度有限),即可以通过有限的训练数据准确地学习到目标函数
  • Corollary 3.1.1:数据覆盖不足的影响

    • 训练数据未覆盖输入空间 X 的所有可能值,模型可能无法正确预测未知输入上的因果关系
  • Corollary 3.1.2:输入空间无限的后果

    • 如果输入空间 X 或输入维度是无限的,无论训练数据集有多大,模型在未知输入上的误差总是可能任意大
  • Theorem 3.2:递归推理与长度泛化

    • 如果因果函数 f 被完全学习,推理问题可以表示为有向无环图(DAG),则通过递归地应用 f ,可以解决任意长度或规模的问题

    • 训练中仅见过小规模问题的模型可以泛化到更长的推理任务

  • Theorem 3.3:局部性条件与滑动窗口机制

    • 滑动窗口是解决长度泛化问题的充分条件

    • 如果推理问题的最大输入元素距离 R < ∞ ,并且训练数据包含所有长度为 4R+1 的子序列(可以通过滑动窗口(长度为 4R+1 )唯一确定下一步推理的输入)

  • Definition 3.3:well-defined 的因果输入恢复

    • 如果推理问题是 (n, r) -一致的,可以定义一个函数 ,通过 n 个长度为 r 的子序列唯一恢复当前推理步骤所需的因果输入
  • Theorem 3.5:从 R < ∞ (1, 4R+1) -一致性

    • 如果 R < ∞ 且每个输入元素最多参与一个推理步骤,则问题是 (1, 4R+1) -一致的
  • Theorem 3.6:因果输入的可恢复性

    • 如果问题是 (n, r) -一致的:

      • 可以通过 n 个长度为 r 的子序列恢复推理步骤中所有的因果输入。

      • 因果输入集合 是well-defined 的,并可以通过函数 \gamma 唯一确定。

  • Theorem 3.7: 的学习性

    • 如果问题是 (n, r) 一致的,函数 可以通过有限训练数据学习。

主要方法

注:本系列不包括基础的知识点讲解,为笔记/大纲性质而非教程,用于论文知识点和思想和快速记忆和回顾,更多细节建议阅读论文原文

相关推荐
Dust-Chasing1 分钟前
Claude Code源码剖析 - 权限系统
人工智能·python·ai
甲维斯1 分钟前
Fable5是真·神!用canvas手搓超级玛丽无bug!
人工智能·游戏开发
小陈phd2 分钟前
Text2SQL智能体学习笔记(二)——NL2SQL落地的隐形基石:元数据库
数据库·笔记·学习
lulu12165440782 分钟前
大模型API聚合平台技术架构深度对比:六大平台协议转换、路由调度与安全治理全解析 - 微元算力(weytoken)
java·人工智能·安全·架构·ai编程
米小虾2 分钟前
我与AI的对话:从大模型的知识本质,到具身智能能否催生真正的知识创造者,再到人的教育与成长
人工智能·aigc
测试者家园3 分钟前
用 Skills 自动生成测试用例:一套可落地方案
人工智能·测试用例·持续测试·职业和发展·ai赋能·智能化测试
上海达策TECHSONIC3 分钟前
零售ERP选型解析:SAP Business One 适配成长型零售企业的核心逻辑
大数据·运维·人工智能·云计算·运维开发·零售
浮午4 分钟前
腾讯AI应用开发一面实录:13道硬核面试题全解析
人工智能·面试·职场和发展
qcx234 分钟前
固定LLM也能自我进化:上海AI Lab Self-Harness论文深度解读 | Agent性能提升60%的秘密
人工智能
阿川20156 分钟前
智能体爆发,HPE存储以创新架构解锁混合云与AI红利
人工智能·存储·智能体·hpe