- prompt层面:首先在prompt中进行schema注入,写好输出示例并使用几组正负示例来规范模型输出。然后在prompt的末尾添加强约束进一步规范,或加校验指令,让模型自我校验格式是否正确。
- 模型层面:使用Structured Outputs,让模型每生成一个token都做语法校验,不符合json字符的语法禁止生成,最终生成预设的JSON结构。
- 代码层面的校验:对模型输出的JSON可以使用Pydantic、json.loads等方法校验json结构。除了对JSON结构的校验外,还可以针对实际业务,比如哪些json是必选字段但没生成、枚举值是否合法、嵌套结构是否完整等。
- 增加重试与降级策略:对于输出结构不对时,让模型结合报错信息重新生成,并追加更强约束的prompt。复杂 JSON 拆分为多个简单 JSON 分段生成,降低单轮生成难度。
- 对于工程化任务增加埋点进行观测,包括JSON 解析失败率、字段缺失率、重试次数、异常文本样本,根据这些异常去调整Prompt,对模型进行微调。
如何让大模型稳定输出JSON格式数据
谷歌玩家2026-06-11 18:41
相关推荐
大鱼>14 天前
大语言模型+物联网:LLM理解物理世界AndrewHZ14 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)生成论实验室14 天前
机器人:一个自主运动的系统Data-Miner15 天前
大语言模型+智能体AI,122页PPT详解落地应用培训!枫叶林FYL15 天前
BRIDGE:多模态查询的强化学习对齐与文本检索重构小小工匠15 天前
拆解大语言模型:从词向量到注意力机制的内部运行原理暮云星影15 天前
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)生成论实验室15 天前
自动驾驶:一个自主运动的系统searchforAI15 天前
啥是LLM?大语言模型从原理到选型的完整科普MartinYeung515 天前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越