Prompt优化 COT/COD

文章目录

- - 基本的方法论框架
  - [COT / COD](#COT / COD)
  - [COT / COD对比](#COT / COD对比)
  - 其他优化点
  - - [1. 示例引导与少样本学习](#1. 示例引导与少样本学习)
    - [2. 角色设定与背景引导](#2. 角色设定与背景引导)
    - [3. 任务分解与步骤引导](#3. 任务分解与步骤引导)

基本的方法论框架

基础要素：指令、背景信息、补充数据（要求）、输出格式、（其他限制条件）

有时背景信息较长，限制信息可能会失效，可以最后再写一个限制信息。

例如：

大模型用来画思维导图

指令：帮我写一个模型训练的思维导图。
背景信息 ：千帆ModelBuilder训练流程为框架。
补充数据 ：思维导图为横版展示。
输出格式：输出内容要有数据准备、模型训练、模型管理和服务管理4大流程。

大模型担任律师

能力与角色 ：你现在是一个资深律师。
背景信息 ：最近你接了一个财务侵占的官司，涉案金额5xxx元，你是受害人的辩护律师。
指令：请帮忙出一个法律公告，警示被告尽快偿还非法侵占的财务。
输出风格 ：公告内容要严谨严肃专业。
输出范围：公告内容不宜超过800字。

COT / COD

Chain of Thought（思维链）

COT（Chain of Thought）是一种通过引导大语言模型（LLM）生成逐步推理过程来提升复杂任务解决能力的技术。其核心在于让模型模仿人类分步骤思考的思维链，将问题分解为多个中间推理环节，最终推导出答案

技术特点：

结构化推理：通过示例或指令要求模型展示"解题过程"，例如数学问题中的分步计算；

可解释性增强：中间步骤的输出便于用户理解模型逻辑，提升信任度；

适用场景：数学推理、符号逻辑、复杂问答等需要多步验证的任务

添加"请逐步思考""分三步论证"等指令，引导模型展示完整推理路径。测试显示该方法可使数学题准确率提升

Chain of Draft（草稿链）

COD（Chain of Draft）是COT的高效演化版本，其核心是仅保留推理中的关键步骤，通过极简的中间表达（如公式、符号）降低计算成本。

技术特点：

极简输出：每个推理步骤仅用5个词以内表达，例如"20-12=8→答案8"；

效率优势：相比COT减少80%的Token使用量，延迟降低40%-76%；

适用场景：实时交互（客服、语音助手）、资源受限环境（手机、IoT设备）

我的应用场景：在RAG等系统中，与大模型交互的中间步骤，有需要大模型判断的节点。

例如：我需要让视觉大模型判断是否已经打开了某个APP。

python 复制代码

{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中，请逐步思考，但每个步骤的描述尽量简洁（不超过10个字）。
            使用分隔符"####"来区分思考过程与最终答案。
            最终只需回答"是"或"否"。"""
}

Prompt拆解：

提供角色
在分析过程中，请逐步思考
每个思考步骤不超过10个字
也可以添加要识别APP的背景信息，如盒马：盒马是一家线上买菜平台

使用通义千问2.5-VL-72B：

python 复制代码

1. COD
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中，请逐步思考，但每个步骤的描述尽量简洁（不超过10个字）。
            使用分隔符"####"来区分思考过程与最终答案。
            最终只需回答"是"或"否"。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图，判断它是否属于盒马APP的页面。
						盒马APP：盒马是一家线上买菜平台。"""
}

回复：搜索框有水果促销信息####是

2. COT
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中，请逐步思考。
            使用分隔符"####"来区分思考过程与最终答案。
            最终只需回答"是"或"否"。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图，判断它是否属于盒马APP的页面。
						盒马APP：盒马是一家线上买菜平台。"""
}

回复：
从屏幕截图中可以看到以下特征：
页面顶部显示了"星宝店"，这是盒马APP中常见的店铺名称。
页面中部有多个分类标签，如"水果鲜花"、"蔬菜豆制品"、"肉禽蛋品"等，这些分类与盒马APP的食品分类一致。
页面底部有"分类"、"盒马小镇"、"购物车"和"我的"等标签，这些标签也是盒马APP的标准导航栏。
页面整体设计风格和布局与盒马APP非常相似。
综合以上分析，可以判断这个屏幕截图属于盒马APP的页面。
是

COT / COD对比

对大模型在数据集GSM8K上对测试，可发现COD的准确率几乎和COT相同。

但在所需Token、延迟时间上，COD有明显的优势。

例如：

问题： 杰森有20个棒棒糖。他给了丹尼一些。现在他还剩下12个。杰森给了丹尼多少个棒棒糖？

1.标准提示（直接答案）

回复： 8

2.思维链（CoT）提示（逐步解释）

回复：

杰森一开始有20个棒棒糖。

给了一些之后，他剩下12个。

要找出他给了多少，我们做减法：20 - 12。

这给出了8。

3.草稿链（CoD）提示（简洁推理）

回复： 20 - 12 = 8 → 最终答案：8.

CoT是全面的，但可能过于繁琐。CoD去除了不必要的部分，保留清晰度的同时节省时间。

其他优化点

1. 示例引导与少样本学习

提供3-5个输入输出示例，帮助模型快速掌握任务模式。如翻译任务可给出中英对照样例
对于创意类任务，给出风格参考（如："模仿鲁迅杂文风格写作"）
对于文本分类，"样例：'CPU性能升级'→科技样例2：'欧冠决赛'→体育请分类：'新型电池技术'"

2. 角色设定与背景引导

明确要求模型扮演特定角色（如科学家、程序员），并设定其职业背景、目标动机，可提升回答的专业性与一致性。例如："你是一名资深营养学家，需用通俗语言解释维生素C的作用"。

科学解释场景
"你是一位量子物理研究员，需用生活化比喻向中学生解释量子纠缠现象"
→ 输出会使用"如同心灵感应的粒子"等类比
商业分析场景
"作为麦肯锡咨询顾问，请用SWOT分析法评估新能源汽车市场"
→ 生成包含竞争优势、政策风险等维度的结构化报告

3. 任务分解与步骤引导

将复杂任务拆解为明确步骤，例如："第一步分析数据特征→第二步建立模型→第三步验证结果"
要求模型先展示推理过程再输出结论，可提升数学类问题的准确性
活动策划："1.确定主题→2.预算分配→3.流程设计→4.风险评估"。→ 生成包含时间轴、应急预案的方案