【提示词工程】提示词Prompt的原理和优化
- [1. 什么是提示词](#1. 什么是提示词)
-
- [1.1 什么是提示工程(Prompt Engineering)](#1.1 什么是提示工程(Prompt Engineering))
- [1.2 模型设置](#1.2 模型设置)
- [2. Prompt的典型构成要素](#2. Prompt的典型构成要素)
- [3. Prompt调优进阶技巧](#3. Prompt调优进阶技巧)
-
- [3.1 少样本提示(Few - Shot)](#3.1 少样本提示(Few - Shot))
- [3.2 链式思考(思维链COT)](#3.2 链式思考(思维链COT))
- [3.3 自我一致性(自洽性,Self-Consistency)](#3.3 自我一致性(自洽性,Self-Consistency))
- [3.4 思维树(Tree-of-thought,ToT)](#3.4 思维树(Tree-of-thought,ToT))
- [4. Prompt攻击与防范](#4. Prompt攻击与防范)
- 附录
1. 什么是提示词
通俗讲:跟大模型说的每一句话都是Prompt,大模型就是在续写你给它的Prompt。
具体讲:提示(Prompt)是用来引导模型输出特定回答或者进行特定任务的一组词语。

1.1 什么是提示工程(Prompt Engineering)
提示工程的核心思想是,通过精心设计的提示,可以显著提高模型的性能和输出质量。
- 貌似简单,但其实意义非凡。(提问的智慧)
- Prompt是AGI时代【编程语言】
- 提示工程师是AGI时代的【程序员】。如果要学好提示工程,那么其实就是要知道如何对咱们的 Prompt进行调优,与大模型进行更好的交互
1.2 模型设置
使用提示词时,您会通过API或直接与大模型进行交互。可以通过配置一些参数以获取不同的提示结果。
- Temperature: 温度值 (越低越真实,越高越发散)
- Top_p:核采样 (越低越真实,越高越发散)
上面两个参数在使用时调整一个就行


2. Prompt的典型构成要素
- Role
角色:定义要模拟的角色或任务,告诉大模型应该扮演什么样的角色。 - Profile
简介:提供关于提示词作者、版本、语言等基础信息。这有助于其他人了解提示词的来源、版本更新等信息。 - Background
背景:对角色或任务进行详细描述,帮助大模型了解他们即将扮演的角色的背景知识。 - Goals
目标:列出此任务的主要目标或希望达到的效果。 - Constrains
约束条件:指明执行任务时需要遵守的规则或约束。 - Definition
详细描述任务中涉及到的特定概念或名词,确保概念对齐。 - Tone
语气风格:描述完成任务时应采取的语言风格或情感基调,例如 "正式"、"随意"、"幽默" 等。 - Skills
技能:列出执行此任务所需的技能或知识。 - Examples
示例:提供完成任务的实际示例或模板,有助于理解任务的要求和预期结果。通过具体示例,大模型可以更加直观地理解任务的要求。 - Workflows
工作流程:描述完成任务的具体步骤或流程。 - OutputFormat
输出格式:描述任务的预期输出格式,例如文本、图表、列表等。确保大模型知道如何格式化他们的答案,使输出结果满足特定的要求或标准。 - Initialization
初始化:提供开始任务时的开场白或初始状态。
一般的话需要: 角色 + 背景 + 目标 + 输出格式
3. Prompt调优进阶技巧
优化方法
- 零样本提示(Zero-Shot)
- 少样本提示(Few-Shot)
- 链式思考(思维链 COT)
- 自我一致性(自洽性,Self-Consistency)
- 思维树(Tree-of-thought,ToT)
3.1 少样本提示(Few - Shot)
适用场景
- 需要严格格式:JSON、表格、固定结构输出。
- 特定领域任务、自定义分类。
- 模型容易理解错规则的任务。

3.2 链式思考(思维链COT)
链式思考(CoT)提示通过中间推理步骤实现了复杂的推理能力。可以将其与少样本提示相结合,以获得更好的结果,以便在回答之前进行推理的更复杂的任务。最为简单的思维链形式是在提示中预留鼓励思考链的语句(如 "让我们一步一步地思考")。
核心思想:先思考,再答案。让模型把推理过程写出来。
示例
问题:一个盒子里有 5 个苹果,吃掉 2 个,又放进去 3 个,现在有几个?
请一步步思考,再给出答案。


思维链COT的挑战

3.3 自我一致性(自洽性,Self-Consistency)
核心思想:多跑几次,投票选最靠谱的答案。
自我一致性是一种对抗幻觉的手段,就像我们做数学题一样,需要多次验算。同样prompt跑多次,通过投票选出最终结果。
-
是什么
对同一个问题,让模型生成多个答案。
选择出现次数最多、最一致的结果。
-
适用场景
数学、逻辑、选择类、有唯一正确答案的问题。
-
工作流程
用 CoT 让模型生成第 1 次答案
再生成第 2 次、第 3 次......
统计哪个答案出现最多 → 最终答案
-
优点
显著降低随机错误。
比单轮生成更稳定。
-
缺点
耗时增加,需要多次调用模型。


3.4 思维树(Tree-of-thought,ToT)
核心思想:像人一样多角度思考,分支探索,择优决策。
-
是什么
把思考过程变成树结构:
根节点:问题
分支:不同思路 / 方案
叶子:不同结果
-
模型会评估每条路径好不好,再选最优。
比 CoT 强在哪
-
CoT 是单一路径思考。
-
ToT 是多路径探索 + 评估 + 回溯。
-
适用场景
创作、规划、策略、复杂推理、多解法问题。
比如:写方案、解难题、策略博弈。
4. Prompt攻击与防范

