【AI黑话日日新】什么是大模型的test-time scaling?摘要:大语言模型(LLM)的性能提升长期依赖“参数扩容、数据增量、训练加算”的训练时缩放(Training-Time Scaling)范式,但该路径面临成本指数级增长、边际收益递减的瓶颈。Test-Time Scaling(TTS,测试时缩放/推理时扩展)作为全新技术范式,无需重新训练模型、不修改权重,仅在推理阶段通过投入额外计算资源、优化推理策略或引入外部验证,即可实现模型输出精度、鲁棒性与推理能力的显著提升。本文从核心定义、本质原理、主流算法分类、数学推导、工程代码实现、性能应用、挑战与未来方向,全面