文章目录
基本的方法论框架
基础要素:指令、背景信息、补充数据(要求)、输出格式、(其他限制条件)
有时背景信息较长,限制信息可能会失效,可以最后再写一个限制信息。
例如:
大模型用来画思维导图
指令 : 帮我写一个模型训练的思维导图。
背景信息 :千帆ModelBuilder训练流程为框架。
补充数据 :思维导图为横版展示。
输出格式:输出内容要有数据准备、模型训练、模型管理和服务管理4大流程。
大模型担任律师
能力与角色 :你现在是一个资深律师。
背景信息 :最近你接了一个财务侵占的官司,涉案金额5xxx元,你是受害人的辩护律师。
指令 : 请帮忙出一个法律公告,警示被告尽快偿还非法侵占的财务。
输出风格 :公告内容要严谨严肃专业。
输出范围:公告内容不宜超过800字。
COT / COD
Chain of Thought(思维链)
COT(Chain of Thought)是一种通过引导大语言模型(LLM)生成逐步推理过程来提升复杂任务解决能力的技术。其核心在于让模型模仿人类分步骤思考的思维链,将问题分解为多个中间推理环节,最终推导出答案
技术特点:
结构化推理:通过示例或指令要求模型展示"解题过程",例如数学问题中的分步计算;
可解释性增强:中间步骤的输出便于用户理解模型逻辑,提升信任度;
适用场景:数学推理、符号逻辑、复杂问答等需要多步验证的任务
- 添加"请逐步思考""分三步论证"等指令,引导模型展示完整推理路径。测试显示该方法可使数学题准确率提升
Chain of Draft(草稿链)
COD(Chain of Draft)是COT的高效演化版本,其核心是仅保留推理中的关键步骤,通过极简的中间表达(如公式、符号)降低计算成本。
技术特点:
极简输出:每个推理步骤仅用5个词以内表达,例如"20-12=8→答案8";
效率优势:相比COT减少80%的Token使用量,延迟降低40%-76%;
适用场景:实时交互(客服、语音助手)、资源受限环境(手机、IoT设备)
我的应用场景:在RAG等系统中,与大模型交互的中间步骤,有需要大模型判断的节点。
例如:我需要让视觉大模型判断是否已经打开了某个APP。
python
{
"role": "system",
"content": """你是一个移动应用识别专家。
请根据提供的移动应用屏幕截图判断目标应用是否匹配。
在分析过程中,请逐步思考,但每个步骤的描述尽量简洁(不超过10个字)。
使用分隔符"####"来区分思考过程与最终答案。
最终只需回答"是"或"否"。"""
}
Prompt拆解:
- 提供角色
- 在分析过程中,请逐步思考
- 每个思考步骤不超过10个字
- 也可以添加要识别APP的背景信息,如盒马:盒马是一家线上买菜平台
使用通义千问2.5-VL-72B:
python
1. COD
{
"role": "system",
"content": """你是一个移动应用识别专家。
请根据提供的移动应用屏幕截图判断目标应用是否匹配。
在分析过程中,请逐步思考,但每个步骤的描述尽量简洁(不超过10个字)。
使用分隔符"####"来区分思考过程与最终答案。
最终只需回答"是"或"否"。"""
}
{
"role": "user",
"content": """请分析这个屏幕截图,判断它是否属于盒马APP的页面。
盒马APP:盒马是一家线上买菜平台。"""
}
回复:搜索框有水果促销信息####是
2. COT
{
"role": "system",
"content": """你是一个移动应用识别专家。
请根据提供的移动应用屏幕截图判断目标应用是否匹配。
在分析过程中,请逐步思考。
使用分隔符"####"来区分思考过程与最终答案。
最终只需回答"是"或"否"。"""
}
{
"role": "user",
"content": """请分析这个屏幕截图,判断它是否属于盒马APP的页面。
盒马APP:盒马是一家线上买菜平台。"""
}
回复:
从屏幕截图中可以看到以下特征:
页面顶部显示了"星宝店",这是盒马APP中常见的店铺名称。
页面中部有多个分类标签,如"水果鲜花"、"蔬菜豆制品"、"肉禽蛋品"等,这些分类与盒马APP的食品分类一致。
页面底部有"分类"、"盒马小镇"、"购物车"和"我的"等标签,这些标签也是盒马APP的标准导航栏。
页面整体设计风格和布局与盒马APP非常相似。
综合以上分析,可以判断这个屏幕截图属于盒马APP的页面。
是
COT / COD对比

对大模型在数据集GSM8K
上对测试,可发现COD的准确率几乎和COT相同。
但在所需Token、延迟时间上,COD有明显的优势。

例如:
问题: 杰森有20个棒棒糖。他给了丹尼一些。现在他还剩下12个。杰森给了丹尼多少个棒棒糖?
1.标准提示(直接答案)
回复: 8
2.思维链(CoT)提示(逐步解释)
回复:
杰森一开始有20个棒棒糖。
给了一些之后,他剩下12个。
要找出他给了多少,我们做减法:20 - 12。
这给出了8。
3.草稿链(CoD)提示(简洁推理)
回复: 20 - 12 = 8 → 最终答案:8.
CoT是全面的,但可能过于繁琐。CoD去除了不必要的部分,保留清晰度的同时节省时间。
其他优化点
1. 示例引导与少样本学习
- 提供3-5个输入输出示例,帮助模型快速掌握任务模式。如翻译任务可给出中英对照样例
- 对于创意类任务,给出风格参考(如:"模仿鲁迅杂文风格写作")
- 对于文本分类,"样例:'CPU性能升级'→科技 样例2:'欧冠决赛'→体育 请分类:'新型电池技术'"
2. 角色设定与背景引导
明确要求模型扮演特定角色(如科学家、程序员),并设定其职业背景、目标动机,可提升回答的专业性与一致性。例如:"你是一名资深营养学家,需用通俗语言解释维生素C的作用"。
- 科学解释场景
"你是一位量子物理研究员,需用生活化比喻向中学生解释量子纠缠现象"
→ 输出会使用"如同心灵感应的粒子"等类比 - 商业分析场景
"作为麦肯锡咨询顾问,请用SWOT分析法评估新能源汽车市场"
→ 生成包含竞争优势、政策风险等维度的结构化报告
3. 任务分解与步骤引导
-
将复杂任务拆解为明确步骤,例如:"第一步分析数据特征→第二步建立模型→第三步验证结果"
-
要求模型先展示推理过程再输出结论,可提升数学类问题的准确性
-
活动策划:"1.确定主题→2.预算分配→3.流程设计→4.风险评估"。→ 生成包含时间轴、应急预案的方案