如何让大模型稳定输出JSON格式数据

  1. prompt层面:首先在prompt中进行schema注入,写好输出示例并使用几组正负示例来规范模型输出。然后在prompt的末尾添加强约束进一步规范,或加校验指令,让模型自我校验格式是否正确。
  2. 模型层面:使用Structured Outputs,让模型每生成一个token都做语法校验,不符合json字符的语法禁止生成,最终生成预设的JSON结构。
  3. 代码层面的校验:对模型输出的JSON可以使用Pydantic、json.loads等方法校验json结构。除了对JSON结构的校验外,还可以针对实际业务,比如哪些json是必选字段但没生成、枚举值是否合法、嵌套结构是否完整等。
  4. 增加重试与降级策略:对于输出结构不对时,让模型结合报错信息重新生成,并追加更强约束的prompt。复杂 JSON 拆分为多个简单 JSON 分段生成,降低单轮生成难度。
  5. 对于工程化任务增加埋点进行观测,包括JSON 解析失败率、字段缺失率、重试次数、异常文本样本,根据这些异常去调整Prompt,对模型进行微调。
相关推荐
大鱼>14 天前
大语言模型+物联网:LLM理解物理世界
物联网·struts·语言模型·多模态·aiot
AndrewHZ14 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
生成论实验室14 天前
机器人:一个自主运动的系统
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
Data-Miner15 天前
大语言模型+智能体AI,122页PPT详解落地应用培训!
人工智能·microsoft·语言模型
枫叶林FYL15 天前
BRIDGE:多模态查询的强化学习对齐与文本检索重构
人工智能·语言模型
小小工匠15 天前
拆解大语言模型:从词向量到注意力机制的内部运行原理
人工智能·语言模型·自然语言处理
暮云星影15 天前
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)
arm开发·人工智能·语言模型·自然语言处理
生成论实验室15 天前
自动驾驶:一个自主运动的系统
人工智能·算法·机器学习·语言模型·机器人·自动驾驶·安全架构
searchforAI15 天前
啥是LLM?大语言模型从原理到选型的完整科普
人工智能·科技·深度学习·ai·语言模型·知识图谱·agent
MartinYeung515 天前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型