prompt高阶优化
思维链
让大模型先输出完整的推理过程,再给出最终答案,模拟人类思考的步骤,大幅提升逻辑推理、数学计算、复杂问题解决能力。
解决的问题:
- 复杂数学题、逻辑题、代码题容易出错
- 模型直接跳步导致结果错误
- 无法追溯答案的推导过程
使用方法:
在提示词末尾加上:请一步步思考,先写出你的推理过程,再给出最终答案。
自我一致性
自我一致性(Self-Consistency):在思维链的基础上,让模型生成多个独立的推理路径和答案,然后通过 "投票" 选择出现次数最多、最一致的答案作为最终结果。
解决的问题
- 单一推理路径可能存在偏差或错误
- 问题存在多种解法,需要验证正确性
- 提升高难度推理任务的准确率
使用方法
请独立生成3种不同的推理过程来解决这个问题,然后对比这3种结果,选择最合理的一个作为最终答案。
常见方法:
多次并行调用:使用完全相同的 Prompt,以 奇数次(3/5/7 次,推荐 3 次)调用模型(可混合不同大模型,如同时调用 GPT-4o、Claude 3.5、通义千问),确保能通过超过半数投票决策。
全量结果收集 :记录每次模型输出的完整推理路径 + 最终结论,不能只收集答案。
结果汇聚分析:将所有结果汇总,可再次交给模型进行自动统计,判断哪个结论在多个推理路径中出现最频繁。
最终答案确定:选择出现次数最多、一致性最高的答案作为最终输出;若出现平票,可增加一次调用打破平局。
示例
问题:计算 1234 × 5678
请独立生成3种不同的计算方法和结果,然后交叉验证,给出最终的正确答案。
思维树
思维树(Tree of Thought, ToT):将复杂问题分解为多个步骤,每个步骤生成多个可能的 "想法",然后对每个想法进行评估、剪枝,保留最优路径继续推进,最终找到全局最优解。
解决的问题:
- 多步骤规划类问题(如写论文大纲、制定旅行计划)
- 需要探索多种可能性的创意类问题
- 单一思维链无法解决的复杂决策问题
使用方法:
请按照以下步骤解决问题:
1. 分解问题为3个关键步骤
2. 为每个步骤生成3个可能的解决方案
3. 评估每个方案的可行性(1-10分)
4. 选择得分最高的方案组合,形成最终答案
示例
问题:帮我制定一个3天的上海旅行计划
请按照思维树的方法:
1. 先列出3天旅行的核心目标
2. 为每天生成3个不同的行程安排
3. 从性价比、体验感、时间合理性三个维度评分
4. 最终整合出最优的3天行程
反思机制
反思机制(Reflection):让模型先生成初稿,然后对自己的输出进行批判性反思,找出问题和不足,最后基于反思结果进行修正,形成 "生成 - 反思 - 修正" 的闭环。
解决的问题
- 输出内容存在逻辑漏洞、事实错误
- 文案、代码质量不高,需要反复修改
- 复杂任务需要多轮迭代优化
使用方法
请先完成任务,然后按照以下标准反思你的输出:
1. 是否存在事实错误或逻辑漏洞?
2. 是否满足所有要求?
3. 有哪些地方可以优化?
最后基于反思结果,给出修正后的最终版本。
示例
任务:写一段关于大模型的介绍文案
请先写出初稿,然后从"是否通俗易懂、是否突出核心优势、是否有吸引力"三个方面进行反思,指出不足,再给出优化后的版本。
ReAct 推理 + 行动
核心原理
ReAct 推理 + 行动(Reasoning + Action):将大模型的推理能力和外部工具调用能力结合,模型先思考 "需要什么信息"、"需要调用什么工具",然后执行工具获取结果,再基于结果继续推理,直到解决问题。
解决的问题
- 需要实时信息的问题(如新闻、股价、天气)
- 需要精确计算的问题
- 需要检索外部知识库的问题
标准流程
思考:我需要什么信息来解决这个问题?
行动:调用[工具名]获取[信息]
观察:工具返回的结果是...
思考:基于这个结果,我接下来需要...
(重复直到问题解决)
最终答案:...
示例
问题:今天北京的气温是多少?
请使用ReAct模式回答:
1. 先思考需要调用什么工具
2. 执行工具获取实时气温
3. 基于结果给出最终答案
开源 ReAct 架构多智能体协作
基于 ReAct 架构,让多个不同角色的智能体分工协作,每个智能体负责一个环节,共同完成复杂的大型任务。
解决的问题:
- 单一智能体无法完成的复杂任务(如写完整的研究报告、开发小型项目)
- 需要多领域专业知识的任务
- 提升输出的全面性和准确性
常见角色分工:
- 规划师:拆解任务,制定整体流程和时间表
- 研究员:调用检索工具,收集相关资料和数据
- 创作者:基于资料生成核心内容
- 校验员:检查内容的事实准确性、逻辑一致性
- 整合者:将各部分内容整合为最终成品
示例:
任务:写一份关于大语言模型发展现状的行业报告
请组建5个智能体团队,分别担任规划师、研究员、创作者、校验员、整合者,按照ReAct流程协作完成报告。
常见react架构
- Camel-AI
- OpenManus
- AutoGPT
- LangGraph
- MetaGPT
结构化prompt结构
RTF
RTF(Role-Task-Format):RTF 是最基础的提示词模板。它主要强调三个核心要素:角色设定(Role)、任务说明(Task)与输出格式(Format)。这种结构简洁高效,适合通用类任务或者简单任务。
使用范围:日常问答、简单写作、信息提取、翻译、基础总结等 80% 通用场景。
结构说明:
- Role(角色):定义模型的身份或专业背景
- Task(任务):说明模型要完成的具体目标
- Format(格式):指定输出的格式、风格或语气
示例:
# Role
你是一名资深市场分析师。
# Task
请分析当前中国新能源汽车市场的发展趋势,指出未来三年的主要增长点。
# Format
请以Markdown表格形式输出,包含"趋势"、"原因"、"预测增长率"三列。
ICIO
ICIO 是输入处理专用框架。它围绕 "如何处理特定输入" 展开,明确处理规则、背景信息、待处理内容和输出要求,是工业界数据处理任务的事实标准。(Instruction-Context-Input-Output)
使用范围:文本摘要、翻译、数据清洗、信息提取、代码审查、格式转换等需要处理特定输入的任务。
结构说明:
- Instruction(指令):明确告诉模型要执行什么操作
- Context(上下文):提供任务相关的背景信息和规则
- Input(输入):待处理的原始内容
- Output(输出):指定输出的格式和要求
示例:
# Instruction
请提取以下文本中的用户收货信息。
# Context
信息来源于电商平台用户下单记录,需提取所有必填字段。
# Input
张三,北京市朝阳区建国路88号SOHO现代城A座1203,电话13800138000,购买了2个便携式榨汁杯,订单号20250601001。
# Output
输出为JSON格式,包含"姓名"、"地址"、"电话"、"购买数量"、"订单号"五个字段。
CRISPE
CRISPE 是专业场景专用框架。它先限定模型的能力范围,再赋予专业角色,结合具体场景和输出风格,生成符合专业要求的内容。(Capacity-Role-Input-Scenario-Personality-Output)
使用范围:专业咨询、法律文书、医疗建议、技术文档、代码调试等需要高度专业性的任务。
结构说明:
- Capacity(能力):限定模型具备的专业能力和知识范围
- Role(角色):定义模型的具体身份和职责
- Input(输入):用户提出的具体问题或需求
- Scenario(场景):说明任务发生的具体场景和背景
- Personality(个性):指定回答的语气和风格
- Output(输出):指定输出的格式和要求
示例:
# Capacity
你具备5年以上Java后端开发经验,熟悉Spring Boot、MyBatis框架和常见错误排查。
# Role
你是我的技术导师。
# Input
Spring Boot项目启动失败,报错"端口8080被占用"。
# Scenario
我正在开发电商项目,需要快速解决问题继续开发。
# Personality
回答简洁明了,步骤清晰,避免晦涩术语。
# Output
分步骤给出解决方案,说明每一步的操作方法和预期结果。
CO-STAR
(Context-Objective-Style-Tone-Audience-Response):CO-STAR 是创作类专用框架,由新加坡政府科技局 (GovTech) 官方推出,获得首届 GPT-4 提示词工程大赛冠军。它全面覆盖创作的所有关键要素,确保输出完全符合预期。
使用范围:文案写作、演讲稿、广告创意、小说创作、报告撰写、营销方案等复杂创作类任务。
结构说明:
- Context(上下文):提供任务相关的背景信息和素材
- Objective(目标):明确创作的核心目标和想要达成的效果
- Style(风格):指定内容的整体风格
- Tone(语气):指定表达的语气
- Audience(受众):明确内容的目标受众
- Response(响应要求):指定输出的格式、字数和其他约束
示例:
# Context
公司推出新型便携式榨汁杯,主打30秒快速榨汁、一键清洗和450g超轻便携。
# Objective
写一条15秒抖音短视频文案,吸引20-30岁年轻女性点击购买。
# Style
清新、活泼、有感染力。
# Tone
亲切口语化,像朋友推荐。
# Audience
20-30岁都市白领女性,注重健康和生活品质。
# Response
文案控制在50字以内,结尾加引导下单话术。
TIDD-EC
TIDD-EC 是最严格的约束型框架。它对任务的每个细节都做出明确规定,最大限度减少模型的自由发挥空间,确保输出完全符合规范。(Task Type-Input-Description-Details-Example-Constraints)
使用范围:代码生成、数据处理、标准化报告、API 文档、接口开发等需要严格遵守规范的任务。
结构说明:
- Task Type(任务类型):明确任务的类型和性质
- Input(输入):任务的输入参数或原始数据
- Description(描述):对任务目标的整体描述
- Details(细节):任务的具体要求和实现细节
- Example(示例):提供 1-2 个示例,让模型直观理解要求
- Constraints(约束):明确禁止的行为和必须遵守的规则
示例:
# Task Type
Python函数编写
# Input
两个整数a和b
# Description
编写一个函数计算两个数的最大公约数。
# Details
使用欧几里得算法,函数名为gcd,参数为a和b,返回最大公约数。
# Example
gcd(12, 18) → 6
gcd(7, 13) → 1
# Constraints
不能使用math.gcd内置函数,代码简洁易懂,添加必要注释。
BROKE
BROKE 是目标导向专用框架,融合 OKR 目标管理逻辑。它以目标为核心,通过可量化的关键结果来衡量任务完成度,解决 AI 输出不可量化、落地性差的问题。(Background-Role-Objective-Key Results-Example-Constraints)
使用范围:项目规划、方案撰写、目标拆解、工作计划、活动策划等目标导向的任务。
结构说明:
- Background(背景):说明任务的背景和现状
- Role(角色):定义模型的身份和职责
- Objective(目标):明确任务的整体目标
- Key Results(关键结果):列出可量化的关键结果,用于衡量任务完成度
- Example(示例):提供参考示例
- Constraints(约束):明确任务的限制条件
示例:
# Background
公司计划3个月内推出便携式榨汁杯的天猫旗舰店运营方案。
# Role
你是电商运营经理。
# Objective
制定完整的天猫旗舰店上线运营方案。
# Key Results
1. 明确3个月销售目标和推广预算
2. 列出3个核心推广渠道和具体活动计划
3. 制定详细的周度执行时间表
# Example
参考同类产品的运营方案结构。
# Constraints
方案具有可执行性,总推广预算控制在10万元以内。
发行
| 框架名称 | 提出者 / 机构 | 首次提出时间 | 官方 / 权威来源 | 补充说明 |
|---|---|---|---|---|
| CO-STAR | Sheila Teo新加坡政府科技局 (GovTech Singapore) | 2023 年 | 官方介绍 (新加坡 GovTech) | 唯一由政府机构官方推出的框架,获得新加坡首届 GPT-4 提示词工程大赛冠军,是目前最权威、应用最广泛的创作类框架 |
| BROKE | 陈财猫EmbraceAGI 社区 | 2024 年 | 官方 GitHub 仓库 | 融合 OKR 目标管理逻辑的强目标导向框架,专为解决 AI 输出不可量化、落地性差的问题设计 |
| RTF (Role-Task-Format) | 社区集体智慧 | 2023 年初 | 最权威系统介绍 | 最基础通用的入门框架,由 ChatGPT 早期用户在实践中总结形成,无单一官方提出者 |
| ICIO (Instruction-Context-Input-Output) | 社区集体智慧 | 2023 年中 | 工程师社区标准定义 | 输入处理专用框架,是工业界数据处理、信息提取任务的事实标准 |
| CRISPE | Matt Nigh | 2023 年 | 原始定义页面 | 专业场景专用框架,最早在 ChatGPT3 时代提出,后被社区扩展为多个变体 |
| TIDD-EC | 社区集体智慧 | 2025 年初 | 首次系统介绍 | 最严格的约束型框架,专为代码生成、标准化报告等需要精确控制的任务设计 |