- prompt层面:首先在prompt中进行schema注入,写好输出示例并使用几组正负示例来规范模型输出。然后在prompt的末尾添加强约束进一步规范,或加校验指令,让模型自我校验格式是否正确。
- 模型层面:使用Structured Outputs,让模型每生成一个token都做语法校验,不符合json字符的语法禁止生成,最终生成预设的JSON结构。
- 代码层面的校验:对模型输出的JSON可以使用Pydantic、json.loads等方法校验json结构。除了对JSON结构的校验外,还可以针对实际业务,比如哪些json是必选字段但没生成、枚举值是否合法、嵌套结构是否完整等。
- 增加重试与降级策略:对于输出结构不对时,让模型结合报错信息重新生成,并追加更强约束的prompt。复杂 JSON 拆分为多个简单 JSON 分段生成,降低单轮生成难度。
- 对于工程化任务增加埋点进行观测,包括JSON 解析失败率、字段缺失率、重试次数、异常文本样本,根据这些异常去调整Prompt,对模型进行微调。
如何让大模型稳定输出JSON格式数据
谷歌玩家2026-06-11 18:41
相关推荐
清辞8533 小时前
Coze从入门到实战---第一、二章Samooyou4 小时前
大模型微调(Fine Tuning)东方佑8 小时前
分形递归状态机 (FRSM) 实验报告-或将实现llm无限上下文MartinYeung510 小时前
[论文学习]透过增强式 Few-Shot Learning 实现高效 PII 从大型语言模型中提取仙女修炼史11 小时前
初代词向量:A Neural Probabilistic Language ModelAndrewHZ1 天前
【LLM技术全景】规模定律与模型演进:为什么模型越大越强?醒醒该学习了!1 天前
大语言模型(理论篇)羊羊小栈1 天前
基于知识图谱(Neo4j)和大语言模型(LLM)的图检索增强(GraphRAG)的数控车床主轴系统故障诊断智能问答系统LoserChaser1 天前
大语言模型基础-与大语言模型交互