
📖标题:Reasoning emerges from constrained inference manifolds in large language models
🌐来源:arXiv, 2605.08142v1
🛎️文章简介
🔸研究问题:大语言模型的推理能力如何在内部表征空间中涌现,能否不依赖标注基准来评估推理质量?
🔸主要贡献:论文发现LLM推理涌现于受约束的推断流形中,提出一种仅基于内部动力学的无标签推理健康诊断指标。
📝重点思路
🔸使用通用认知刺激作为输入,在多个模型家族和规模上提取推理过程中每层最后一个token的隐藏状态,构建高维表征空间中的推断轨迹。
🔸通过内在维度估计方法量化表征轨迹的维度压缩程度,发现推理动力学自发坍缩到远低于嵌入维度的低维流形上。
🔸引入信息体积度量来评估压缩流形内的信息承载能力,发现仅靠维度压缩不足以保证鲁棒推理。
🔸提出统一的无标签诊断指标H,综合表征表达力、自发流形压缩和压缩子空间内非退化信息体积三个结构约束条件。
🔎分析总结
🔸推理表征在推断过程中自发组织为低维流形,内在维度随网络深度快速下降并稳定在个位数水平。
🔸低维结构本身不能解释推理性能差异,过度压缩会导致信息贫乏的病态动力学。
🔸有效推理需要三个条件协同满足:充足的表征表达力、自发流形压缩、压缩流形内保留非退化信息体积。
🔸提出的诊断指标H与下游推理性能高度相关,能够在不依赖任务标注的情况下区分结构健康的推断与病态动力学。
💡个人观点
论文将推理从黑箱输入输出映射转变为可分析的内在动力学过程,首从几何和信息论视角刻画了LLM推理的结构性约束。
