调用大模型做结构化输出时，最头疼的不是模型能力不行，而是它总爱在JSON外面套一层"这是您要的结果："或者末尾加一句"有需要随时问我"。上周后端同事对接的合同抽取服务就因为这个挂了，日志里全是一堆JSON解析异常。为了找到让Claude 4.8稳定裸出JSON的方法，我干脆在KULAAI镜像站（mf.877ai.cn）上反复调了一下午提示词。这个平台把Gemini、ChatGPT、Claude、Grok、DeepSeek都聚合在一起，手机或邮箱注册就能用，不用处理网络问题。下面这5个黄金模板，就是那一下午死磕出来的成果，覆盖了从简单键值对到复杂嵌套Schema、从单轮抽取到流式防截断的所有高频需求。

模板一：基础键值对------锁死键名，禁止废话

最简单的场景，比如提取一个会议通知里的时间、地点、主题，用这个模板稳如磐石：

text

从以下文本中提取会议信息，严格按照JSON格式输出，键名固定为：subject, date, time, location。若某字段缺失，值填"未知"。不要输出任何JSON之外的内容。

文本：{粘贴内容}

核心在于"键名固定"和"不要输出任何JSON之外的内容"这两句，前者防止模型自由发挥键名，后者直接卡掉寒暄。

模板二：复杂Schema------把JSON Schema直接塞进提示词

当要提取的字段很多，甚至包含嵌套对象和数组时，最好的办法是直接给一份JSON Schema。Claude 4.8对Schema的跟随能力极强：

text

你需要根据输入文本生成一个用户订单对象，严格遵循以下JSON Schema：

{

"type": "object",

"properties": {

"order_id": {"type": "string"},

"items": {

"type": "array",

"items": {

"type": "object",

"properties": {

"name": {"type": "string"},

"quantity": {"type": "integer"},

"unit_price": {"type": "number"}

"required": $"name", "quantity", "unit_price"$

}

"total": {"type": "number"}

"required": $"order_id", "items", "total"$

}

只输出符合Schema的JSON，不输出任何解释。

文本：{粘贴文本}

Schema一给，模型会主动对齐类型和必填字段，漏输出的概率大幅降低。

模板三：带引用溯源的结构化输出

有时不只要结果，还要知道每个字段是从原文哪句话来的。这在合同审核、医疗文书解析中尤其重要。提示词可以这样写：

text

从以下内容中提取药物不良反应事件，输出JSON数组。每个事件对象包含：drug（药品名）、reaction（不良反应）、evidence（原文中支持此反应的句子原文引用）。只输出JSON，不要解释。

内容：{粘贴文本}

加了evidence字段并要求"原文引用"，等于逼着模型逐句对账，有效抑制幻觉。

模板四：多步骤推理后输出结构化结果

有些任务需要先推理再输出，比如情感分析+关键要素提取。若直接让模型输出JSON，它可能跳过推理导致不准。模板可以这样设计：

text

请先在心里分析以下客服对话的客户情绪、核心诉求和是否涉及退款，然后将分析结论填入以下JSON（不要输出思考过程）：

{

"emotion": "正面/负面/中性",

"core_demand": "一句话概括",

"refund_related": true/false

}

只输出JSON。

对话：{粘贴对话}

"先在心里分析......不要输出思考过程"这个指令能触发模型进行隐式推理，从而提升准确率，同时输出依然干净。

模板五：流式JSON输出的防截断策略

在做实时结构化抽取时，流式输出的JSON很容易因为分片截断而破坏完整性。一个有效的工程方案是配合提示词加上特殊结束标记：

text

输出以下格式的JSON，并在JSON结束后立即输出 $END_JSON$ 标记，不要有其他内容：

{

"summary": "总结内容",

"keywords": $"关键词1", "关键词2"$

}

END_JSON

文本：{粘贴内容}

后端代码可以缓冲所有chunk，遇到 $END_JSON$ 就立即截断并解析，彻底解决流式解析中断的问题。代码实现如下：

python

import json

buffer = ""

for chunk in stream:

buffer += chunk

if " $END_JSON$ " in buffer:

json_str = buffer.split(" $END_JSON$ ") $0$ .strip()

try:

data = json.loads(json_str)

处理data

except:

pass

break

这五个模板本质上都是在做同一件事：用极其清晰的边界条件，压缩模型的"自由发挥"空间。真正用起来之后你会发现，Claude 4.8的结构化输出稳定到什么程度，并不取决于模型本身多聪明，而取决于你给它画的格子有多精确。把这套提示词工程方法直接套到自己业务上，大多数情况都是改改字段名就能用。

Claude 4.8 提示词工程：结构化输出的5个黄金模板

处理data