推理退化:为什么大模型会输出乱码、死循环和无意义文本用过 ChatGPT、Claude 或本地部署的开源模型的人,大概率都见过下面这类现象:模型本来在正常回答,突然开始重复同一个词、同一句话,像卡住了一样无限循环;或者突然输出一堆无法显示的乱码、控制字符、纯数字串;更极端的情况,输出直接变成空或截断,模型像是「死」在了某一步。这些现象不是某个模型的质量问题,也不是 prompt 写得不够好——几乎所有 Decoder-only 大语言模型在足够长的推理中都会表现出退化倾向,只是触发条件和严重程度不同。