提示词强化1:三个让大模型更「听话」的习惯
要把大模型用好,**提示词(Prompt)**往往比换模型更先见效:同样的接口与参数,写清楚约束与格式,既容易得到可用结果,也更容易控制长度、节省无效往返带来的 token 成本。
本文把日常写作里最常见的三类做法收束成三条------结构化 、分步 、约定 JSON 输出------并说明各自解决什么问题、适合什么场景。文中的 Coze、豆包、DeepSeek、Kimi 等仅作实践入口示例,换任意兼容的聊天 API 同样适用。
先说结论:有效提示词的核心是「说人话」
当代文本大模型普遍能读较长、较复杂 的自然语言说明,参数规模越大,对「段落式需求」的耐受往往越好。因此最底层的一条原则并不玄乎:把模型当成能干的协作者,用明确、无歧义的人类语言交代背景、任务与验收标准。
同时要接受一点:不同厂商、不同系列对同一句「人话」的敏感度并不相同 。下面三条技巧,本质上都是在「说人话」的基础上,再叠一层可重复、可迁移的写法,方便你在多模型之间切换时仍稳住输出形态。
技巧一:结构化提示词------用 Role / Task / Result 钉住边界
提示词框架(Prompt Framework)指:用一组位置固定、语义清晰的段落,引导模型稳定地产出某一类内容。它的直接收益是:相关性更高、废话更少、越界更少。
框架可以很复杂(例如面向「AI 面试官」类场景的 RCSA :Role--Context--Situation--Action),也可以极简。下面这段在 Coze 智能体的「人设与回复逻辑」里很常见,本质是 Role(你是谁)+ Task(做什么)+ Result(结果要满足什么):
text
你是一位曾经就职于互联网头部企业的资深软件工程师和 IT 教育专家,擅长用通俗易懂的语言给初学者讲解技术方向的基本概念与入门知识。
根据用户的输入,整理一门入门级技术课程的大纲,要求:
1. 注重基本概念和原理,为学员打下扎实基础
2. 具有实操性,注重实用性
3. 内容不要求大而全,要循序渐进,适合初级学员掌握
4. 准备的案例简单而兼具趣味与挑战
5. 展望未来,适当介绍一些新技术和技术趋势
读者可以做一个对照实验 :同一段用户主题,分别用「上面一整段结构化提示」与「一句泛泛的『帮我写个大纲』」去调 DeepSeek、豆包、Kimi 等,对比大纲的完整度、条理性与是否跑题------通常结构化版本会明显更稳。
技巧二:分步思考与工作流------把「一次想清」拆成「几步做对」
若没有启用深度推理类模型 (例如带显式思维链的 DeepSeek-R1 一类),仍希望模型先想后写、少跳步 ,可以借助 Coze 等工作流 :前一个节点专门「构思课程设计思路」,后一个节点再「根据思路生成大纲或章节」。每一步的输入输出边界清晰,模型更容易把注意力花在当前子任务上。
这与注意力机制带来的直观体验一致:单次交互里,一件事说透,往往比把五件事揉进同一段里效果更好。工作流的价值,就是把「一件大事」拆成「多条小消息、多个小目标」,降低每一步的认知负荷。
若业务上必须单次调用就返回多种信息 (例如既要摘要又要标签),可以再叠输出格式约定(见下一条),与工作流并不互斥:工作流管「阶段」,JSON 管「字段」。
技巧三:约定 JSON 输出------用 schema「偷懒」表达复杂需求
文本模型对 JSON 形态的结构 通常非常敏感:字段名本身带有语义,模型会倾向于按 key 去填充 value,有时反而不必在 prose 里把每个细节展开成长篇规则。
例如视觉课里常见的需求:看图、选一个简单英文词、再给例句与讲解。可以把「段落怎么写、问句放哪」写进字段说明里,整体仍是一段可解析的 JSON。下面给出一份字段名已统一为常见英文拼写的示例(便于直接进生产解析逻辑;若你手头课件沿用旧字段名,只要在解析层做映射即可):
json
{
"image_description": "图片描述",
"representative_word": "图片代表的英文单词",
"example_sentence": "结合英文单词和图片描述,给出一个简单的例句",
"explanation": "结合图片解释英文单词;段落以 Look at... 开头;分句时每句单独一行;末尾给一个与日常生活有关的问句",
"explanation_replies": [
"根据 explanation 中问句给出的回复示例 1",
"根据 explanation 中问句给出的回复示例 2"
]
}
收益 :下游程序可以 JSON.parse(或容错解析)后直接驱动 UI、入库或接 TTS,不必再从自然语言里正则抠字段。
代价 :JSON 在语法上要「等整段结构闭合」才方便严格解析,与流式输出(SSE)边下边用天然有点张力------要么流式阶段只展示「打字机效果」、最后再解析整块 JSON,要么在后续课程里专门讲「流式 + 结构化」的折中方案(例如 NDJSON、服务端缓冲、或工具调用 schema)。这也是工程上常单独拿出来优化的一类问题。
小结:三条技巧分别解决什么
| 技巧 | 主要解决的问题 | 典型用法 |
|---|---|---|
| 结构化提示词 | 角色漂移、要求遗漏 | Role / Task / 约束列表 |
| 分步工作流 | 一步塞太多导致质量下降 | Coze 多节点串联 |
| JSON 输出 | 下游要稳定字段、少解析成本 | 视觉课、卡片类应用 |
先把「人话」写清楚,再按需叠上表里的某一层,多数场景就够用了。