Prompt优化 COT/COD

文章目录

      • 基本的方法论框架
      • [COT / COD](#COT / COD)
      • [COT / COD对比](#COT / COD对比)
      • 其他优化点
        • [1. 示例引导与少样本学习](#1. 示例引导与少样本学习)
        • [2. 角色设定与背景引导](#2. 角色设定与背景引导)
        • [3. 任务分解与步骤引导](#3. 任务分解与步骤引导)

基本的方法论框架

基础要素:指令、背景信息、补充数据(要求)、输出格式、(其他限制条件)

有时背景信息较长,限制信息可能会失效,可以最后再写一个限制信息。

例如:

大模型用来画思维导图

指令 : 帮我写一个模型训练的思维导图。
背景信息 :千帆ModelBuilder训练流程为框架。
补充数据 :思维导图为横版展示。
输出格式:输出内容要有数据准备、模型训练、模型管理和服务管理4大流程。

大模型担任律师

能力与角色 :你现在是一个资深律师。
背景信息 :最近你接了一个财务侵占的官司,涉案金额5xxx元,你是受害人的辩护律师。
指令 : 请帮忙出一个法律公告,警示被告尽快偿还非法侵占的财务。
输出风格 :公告内容要严谨严肃专业。
输出范围:公告内容不宜超过800字。

COT / COD

Chain of Thought(思维链)

COT(Chain of Thought)是一种通过引导大语言模型(LLM)生成逐步推理过程来提升复杂任务解决能力的技术。其核心在于让模型模仿人类分步骤思考的思维链,将问题分解为多个中间推理环节,最终推导出答案

技术特点:

结构化推理:通过示例或指令要求模型展示"解题过程",例如数学问题中的分步计算;

可解释性增强:中间步骤的输出便于用户理解模型逻辑,提升信任度;

适用场景:数学推理、符号逻辑、复杂问答等需要多步验证的任务

  • 添加"请逐步思考""分三步论证"等指令,引导模型展示完整推理路径。测试显示该方法可使数学题准确率提升

Chain of Draft(草稿链)

COD(Chain of Draft)是COT的高效演化版本,其核心是仅保留推理中的关键步骤,通过极简的中间表达(如公式、符号)降低计算成本。

技术特点:

极简输出:每个推理步骤仅用5个词以内表达,例如"20-12=8→答案8";

效率优势:相比COT减少80%的Token使用量,延迟降低40%-76%;

适用场景:实时交互(客服、语音助手)、资源受限环境(手机、IoT设备)

我的应用场景:在RAG等系统中,与大模型交互的中间步骤,有需要大模型判断的节点。

例如:我需要让视觉大模型判断是否已经打开了某个APP。

python 复制代码
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中,请逐步思考,但每个步骤的描述尽量简洁(不超过10个字)。
            使用分隔符"####"来区分思考过程与最终答案。
            最终只需回答"是"或"否"。"""
}

Prompt拆解:

  1. 提供角色
  2. 在分析过程中,请逐步思考
  3. 每个思考步骤不超过10个字
  4. 也可以添加要识别APP的背景信息,如盒马:盒马是一家线上买菜平台

使用通义千问2.5-VL-72B:

python 复制代码
1. COD
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中,请逐步思考,但每个步骤的描述尽量简洁(不超过10个字)。
            使用分隔符"####"来区分思考过程与最终答案。
            最终只需回答"是"或"否"。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图,判断它是否属于盒马APP的页面。
						盒马APP:盒马是一家线上买菜平台。"""
}

回复:搜索框有水果促销信息####是

2. COT
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中,请逐步思考。
            使用分隔符"####"来区分思考过程与最终答案。
            最终只需回答"是"或"否"。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图,判断它是否属于盒马APP的页面。
						盒马APP:盒马是一家线上买菜平台。"""
}

回复:
从屏幕截图中可以看到以下特征:
页面顶部显示了"星宝店",这是盒马APP中常见的店铺名称。
页面中部有多个分类标签,如"水果鲜花"、"蔬菜豆制品"、"肉禽蛋品"等,这些分类与盒马APP的食品分类一致。
页面底部有"分类"、"盒马小镇"、"购物车"和"我的"等标签,这些标签也是盒马APP的标准导航栏。
页面整体设计风格和布局与盒马APP非常相似。
综合以上分析,可以判断这个屏幕截图属于盒马APP的页面。
是

COT / COD对比

对大模型在数据集GSM8K上对测试,可发现COD的准确率几乎和COT相同。

但在所需Token、延迟时间上,COD有明显的优势。

例如:

问题: 杰森有20个棒棒糖。他给了丹尼一些。现在他还剩下12个。杰森给了丹尼多少个棒棒糖?

1.标准提示(直接答案)

回复: 8

2.思维链(CoT)提示(逐步解释)

回复:

杰森一开始有20个棒棒糖。

给了一些之后,他剩下12个。

要找出他给了多少,我们做减法:20 - 12。

这给出了8

3.草稿链(CoD)提示(简洁推理)

回复: 20 - 12 = 8 → 最终答案:8.

CoT是全面的,但可能过于繁琐。CoD去除了不必要的部分,保留清晰度的同时节省时间。

其他优化点

1. 示例引导与少样本学习
  • 提供3-5个输入输出示例,帮助模型快速掌握任务模式。如翻译任务可给出中英对照样例
  • 对于创意类任务,给出风格参考(如:"模仿鲁迅杂文风格写作")
  • 对于文本分类,"样例:'CPU性能升级'→科技 样例2:'欧冠决赛'→体育 请分类:'新型电池技术'"
2. 角色设定与背景引导

明确要求模型扮演特定角色(如科学家、程序员),并设定其职业背景、目标动机,可提升回答的专业性与一致性。例如:"你是一名资深营养学家,需用通俗语言解释维生素C的作用"。

  1. 科学解释场景
    "你是一位量子物理研究员,需用生活化比喻向中学生解释量子纠缠现象"
    → 输出会使用"如同心灵感应的粒子"等类比
  2. 商业分析场景
    "作为麦肯锡咨询顾问,请用SWOT分析法评估新能源汽车市场"
    → 生成包含竞争优势、政策风险等维度的结构化报告
3. 任务分解与步骤引导
  • 将复杂任务拆解为明确步骤,例如:"第一步分析数据特征→第二步建立模型→第三步验证结果"

  • 要求模型先展示推理过程再输出结论,可提升数学类问题的准确性

  • 活动策划:"1.确定主题→2.预算分配→3.流程设计→4.风险评估"。→ 生成包含时间轴、应急预案的方案

相关推荐
琑9513 分钟前
Next.js项目MindAI教程 - 第四章:用户认证系统
开发语言·javascript·数据库·人工智能·mysql·typescript·node.js
pen-ai13 分钟前
【NLP】 8. 处理常见词(Stopwords)的不同策略
人工智能·自然语言处理
乱世刀疤3 小时前
AI绘画软件Stable Diffusion详解教程(11):图生图进阶篇(局部用上传蒙版重绘)
人工智能·ai作画·stable diffusion
朱剑君3 小时前
用Python打造AI玩家:挑战2048,谁与争锋
人工智能·python
东临碣石824 小时前
【AI论文】MM-Eureka:基于规则的大规模强化学习探索视觉“啊哈”时刻
人工智能
訾博ZiBo5 小时前
AI日报 - 2025年3月17日
人工智能
树莓集团5 小时前
树莓科技集团董事长:第五代产业园运营模式的深度剖析与展望
大数据·人工智能·科技·物联网·百度
晴空对晚照5 小时前
【论文阅读】AlexNet——深度学习奠基作之一
论文阅读·人工智能·深度学习
孔令飞6 小时前
16 | 实现简洁架构的 Store 层
人工智能·ai·云原生·golang·kubernetes