Few-shot / Chain-of-Thought 提示技巧

day11:理解Few-shot / Chain-of-Thought 提示技巧

第一部分:核心概念解析


1. Few-shot Prompting (少样本提示)

  • 是什么?

    在提示词中给模型提供一个或多个具体的例子(Input -> Output),让模型"照葫芦画瓢"。

  • 为什么需要它?

大模型虽然博学(Zero-shot/零样本能力强),但在处理特定格式、特定语气或复杂任务时,直接问它可能会出错或格式不统一。给它看几个例子,它能迅速学会上下文规律(In-context Learning)。

  • 核心公式:

Prompt=任务说明+示例1+示例2+⋯+你的新问题


2. Chain-of-Thought (CoT, 思维链)

  • 是什么?

不仅要求模型给结果,还要求模型展示推理过程。

  • 为什么需要它?

对于数学题、逻辑推理或复杂分类,如果直接让模型给答案,它容易"凭直觉"瞎猜(产生幻觉)。强制它一步步推理,能大幅提高准确率。

  • 两种主要形式:

    • Zero-shot CoT: 只要在结尾加一句魔法咒语:"请一步步思考 (Let's think step by step)"。

    • Few-shot CoT: 在给出的例子(Few-shot)中,把推理过程(CoT)写出来给模型看。


第二部分:从0开始的实战 Demo

为了让你直观感受区别,我们设计一个**"逻辑推理题"**场景。请打开你常用的 AI(ChatGPT, Claude, Gemini 等),跟随以下步骤操作。

场景设定

我们要计算一个虚拟的"外星货币兑换"问题,这个问题稍微有点绕,直接问容易错。

复制代码
已知规则:

1 个"咕噜币" = 3 个"咔嚓币"

1 个"咔嚓币" = 5 个"人类硬币"

但是,如果你一次性兑换超过 5 个"咕噜币",你会获得 10 个额外的"人类硬币"作为奖励。

第 1 步:Zero-shot (直接问,容易翻车或解释不清)

请复制以下提示词给 AI:

复制代码
已知规则:
1 个"咕噜币" = 3 个"咔嚓币"
1 个"咔嚓币" = 5 个"人类硬币"
如果你一次性兑换超过 5 个"咕噜币",你会额外获得 10 个"人类硬币"作为奖励。

问题:小明有 6 个"咕噜币",他能换多少个"人类硬币"?直接告诉我答案。
  • 预期结果: AI 通常能答对,但有时会忽略奖励规则,或者直接丢出一个数字,如果数字错了你都不知道错在哪。

第 2 步:Few-shot (给例子,规范格式)

现在,我们想让 AI 按照特定格式输出,确保它理解规则。我们将提供一个例子(Few-shot)。

请复制以下提示词给 AI:

复制代码
任务:根据外星货币规则计算兑换结果。

规则:
1 咕噜 = 3 咔嚓
1 咔嚓 = 5 硬币
兑换 > 5 咕噜,额外奖励 10 硬币。

例子 1:
输入:小红有 2 个"咕噜币"。
输出:30 个"人类硬币"。

例子 2:
输入:小刚有 4 个"咕噜币"。
输出:60 个"人类硬币"。

问题:小明有 6 个"咕噜币",他能换多少个"人类硬币"?
  • 预期结果: AI 会非常顺从地模仿例子 1 和 2 的简短格式,直接输出 90 个"人类硬币"(或者它计算错误的数字)。
  • 缺陷: 这里的例子太简单(都没触发奖励规则),模型可能会单纯模仿简单的乘法逻辑,从而忽略"额外奖励"的条件,导致算错(6 * 3 * 5 = 90,若是忘了加10,答案就是错的)。

第 3 步:Few-shot + CoT (终极形态:既给例子,又教推理)

这是最强大的技巧。我们在例子里把**思考过程(思维链)**写出来,强迫模型模仿这个思考过程。

请复制以下提示词给 AI:

复制代码
任务:根据外星货币规则计算兑换结果,请展示详细计算逻辑。

规则:
1 咕噜 = 3 咔嚓
1 咔嚓 = 5 硬币
兑换 > 5 咕噜,额外奖励 10 硬币。

例子 1:
输入:小红有 2 个"咕噜币"。
思维过程:
1. 先计算基础兑换:2 咕噜 * 3 = 6 咔嚓。
2. 然后换成硬币:6 咔嚓 * 5 = 30 硬币。
3. 检查奖励条件:2 咕噜没有超过 5,所以没有奖励。
4. 总计:30 硬币。
输出:30 个"人类硬币"。

例子 2:
输入:大壮有 10 个"咕噜币"。
思维过程:
1. 先计算基础兑换:10 咕噜 * 3 = 30 咔嚓。
2. 然后换成硬币:30 咔嚓 * 5 = 150 硬币。
3. 检查奖励条件:10 咕噜超过了 5,需要加上 10 个额外硬币。
4. 总计:150 + 10 = 160 硬币。
输出:160 个"人类硬币"。

问题:小明有 6 个"咕噜币",他能换多少个"人类硬币"?

预期结果: AI 会完美地模仿你的"思维过程"格式:

  • 算出 6 * 3 = 18 咔嚓

  • 算出 18 * 5 = 90 硬币

  • 关键点: 它会显式地写出"6 超过了 5,触发奖励"。

  • 算出 90 + 10 = 100。

    **最终答案:1最终答案:100(正确)。

相关推荐
深度学习lover1 小时前
<项目代码>yolo遥感航拍船舶识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·遥感船舶识别
Coovally AI模型快速验证1 小时前
基于SimCLR的自监督 YOLO:YOLOv5/8也能在低标注场景目标检测性能飙升
人工智能·科技·yolo·目标检测·机器学习·计算机视觉
不老刘2 小时前
新一代图像生成工具:Nano Banana Pro 带来更自然的创作体验
人工智能·google·gemini·nano banana pro
袁庭新2 小时前
人人都能学AI,人人都要学AI
人工智能·aigc
Tzarevich2 小时前
前端调用大语言模型:基于 Vite 的工程化实践与 HTTP 请求详解
人工智能
Soonyang Zhang2 小时前
MoeDistributeDispatch算子代码阅读
人工智能·算子·ascendc
sanggou2 小时前
Windsurf AI IDE 完全使用指南
ide·人工智能
2501_941870563 小时前
人工智能与未来的工作:自动化与人类协作的新时代
大数据·人工智能