实战·第八篇：当模型陷入死循环——FACA破解JSON生成的架构陷阱

实战·第八篇：当模型陷入死循环------FACA破解JSON生成的架构陷阱

模型反复生成JSON校验失败导致死循环------不是它笨，是架构让它在错误的方向上反复努力。

在《实战·第七篇》中，我们完成了核心架构调整："模型做设计，工具生成JSON"。验证中却出现新问题------模型反复调用校验脚本，每次都报"JSON格式错误"，然后重试、再报错、再重试......

通过FACA失效分析逐层拆解，我们定位到一个更深层的架构设计缺陷：模型擅长"创造性设计"，不擅长"文件系统管理"。而脚本的输入设计，恰好要求模型完成一件它天生不擅长的事。

一、现象

makefile 复制代码

迭代1: 生成JSON → write_file写入 → check_material.py校验 → JSON格式错误
迭代2: 重新生成 → 再次写入 → 校验 → 仍错误
...
迭代N: 重复上述过程 → 直到内容熔断介入

表面看是"模型生成的JSON有语法错误"。FACA逐层分析后发现，根因远比这更深。

二、FACA三层根因

第一层：工具使用不当

模型使用run_command将JSON字符串传入校验脚本，但在shell中转义时反复出错------引号、冒号、中文key在shell环境中被错误解析。

第二层：文件路径模式与模型能力错配（根因）

check_material.py要求传入文件路径：

bash 复制代码

python check_material.py /app/workspace/plan.json

模型必须：①生成JSON → ②write_file写入磁盘 → ③记住路径 → ④构造命令调用。

问题：模型是概率生成器，不是文件系统管理器。路径写错、文件名记错、忘记写文件------这些错误导致校验失败，而模型只能"再试一次"。

核心洞察：要求一个擅长"理解意图"的系统，去完成"管理文件路径"的确定性任务------这是架构层面的错配。

第三层：无重试上限

即使校验失败，系统也没有限制重试次数。模型不断尝试，直到内容熔断介入------浪费大量tokens和用户时间。

三、根本原因

问题	为什么模型搞不定
JSON引号/冒号被shell解析	shell对特殊字符敏感，模型无法预判转义结果
模型忘记写文件	模型是"对话式"的，不是"事务性"的
路径拼写错误	模型对长路径的记忆不可靠
校验失败后反复重试	模型没有"放弃"的概念

四、根治方案：stdin支持

既然模型擅长"填参数"而非"管理路径"，就让模型只填参数，路径管理交给平台。

修改前：

javascript 复制代码

模型 → write_file写JSON → check_material.py <文件路径>

修改后：

bash 复制代码

模型 → 输出JSON → echo '<JSON>' | python check_material.py（stdin模式）

核心代码：

python 复制代码

if __name__ == '__main__':
    if len(sys.argv) >= 2:
        # 模式1：文件路径（保留，向后兼容）
        exit_code = check(sys.argv[1])
    else:
        # 模式2：stdin（新增）
        content = sys.stdin.read().strip()
        exit_code = check_from_string(content)
    sys.exit(exit_code)

设计原则	原设计	新设计
模型职责	生成JSON + 管理文件 + 拼接路径	Top3/Top5方案设计（创造性工作）
工具职责	-	JSON生成 + 验证（确定性工作）
模型匹配	要求"事务管理"	发挥"创造性设计"强项

五、补充防护：重试上限

python 复制代码

MAX_RETRY_PER_STAGE = 3

for attempt in range(MAX_RETRY_PER_STAGE):
    result = execute_validation()
    if result['exit_code'] == 0:
        break
    if attempt == MAX_RETRY_PER_STAGE - 1:
        result['status'] = 'PENDING_REVIEW'  # 降级，不阻塞主流程
        break

六、效果

指标	优化前	优化后
校验失败率	~30%	<5%
最大迭代轮数	无限（直至熔断）	≤3轮
模型需管理的步骤	4步（生成+写+记路径+调脚本）	1步（输出JSON内容）

业界参照：Temporal的Durable Execution强调"失败后从断点恢复"而非"让模型反复重试"；LangGraph的节点化设计允许在工作流层级插入确定性校验，而非依赖模型在每个对话轮次中"自觉"完成。

七、总结

架构错配：要求模型管理文件路径 → 模型反复出错 → 无重试上限 → 死循环。

修复的本质是将"模型不擅长的确定性操作"从对话流中剥离，交给工具和平台处理 ，与第七篇"模型做设计，工具生成JSON"一脉相承------平台负责现实边界，Skill负责领域契约，模型负责创造性方案设计，工具负责JSON和workflow确定性生成。

念念不忘，必有回响。

标签：#FACA #死循环 #架构优化 #Agent平台 #stdin

专栏：《JiuwenClaw 企业级部署实战》实战·第八篇