Few-shot / Chain-of-Thought 提示技巧

day11:理解Few-shot / Chain-of-Thought 提示技巧

第一部分:核心概念解析


1. Few-shot Prompting (少样本提示)

  • 是什么?

    在提示词中给模型提供一个或多个具体的例子(Input -> Output),让模型"照葫芦画瓢"。

  • 为什么需要它?

大模型虽然博学(Zero-shot/零样本能力强),但在处理特定格式、特定语气或复杂任务时,直接问它可能会出错或格式不统一。给它看几个例子,它能迅速学会上下文规律(In-context Learning)。

  • 核心公式:

Prompt=任务说明+示例1+示例2+⋯+你的新问题


2. Chain-of-Thought (CoT, 思维链)

  • 是什么?

不仅要求模型给结果,还要求模型展示推理过程。

  • 为什么需要它?

对于数学题、逻辑推理或复杂分类,如果直接让模型给答案,它容易"凭直觉"瞎猜(产生幻觉)。强制它一步步推理,能大幅提高准确率。

  • 两种主要形式:

    • Zero-shot CoT: 只要在结尾加一句魔法咒语:"请一步步思考 (Let's think step by step)"。

    • Few-shot CoT: 在给出的例子(Few-shot)中,把推理过程(CoT)写出来给模型看。


第二部分:从0开始的实战 Demo

为了让你直观感受区别,我们设计一个**"逻辑推理题"**场景。请打开你常用的 AI(ChatGPT, Claude, Gemini 等),跟随以下步骤操作。

场景设定

我们要计算一个虚拟的"外星货币兑换"问题,这个问题稍微有点绕,直接问容易错。

复制代码
已知规则:

1 个"咕噜币" = 3 个"咔嚓币"

1 个"咔嚓币" = 5 个"人类硬币"

但是,如果你一次性兑换超过 5 个"咕噜币",你会获得 10 个额外的"人类硬币"作为奖励。

第 1 步:Zero-shot (直接问,容易翻车或解释不清)

请复制以下提示词给 AI:

复制代码
已知规则:
1 个"咕噜币" = 3 个"咔嚓币"
1 个"咔嚓币" = 5 个"人类硬币"
如果你一次性兑换超过 5 个"咕噜币",你会额外获得 10 个"人类硬币"作为奖励。

问题:小明有 6 个"咕噜币",他能换多少个"人类硬币"?直接告诉我答案。
  • 预期结果: AI 通常能答对,但有时会忽略奖励规则,或者直接丢出一个数字,如果数字错了你都不知道错在哪。

第 2 步:Few-shot (给例子,规范格式)

现在,我们想让 AI 按照特定格式输出,确保它理解规则。我们将提供一个例子(Few-shot)。

请复制以下提示词给 AI:

复制代码
任务:根据外星货币规则计算兑换结果。

规则:
1 咕噜 = 3 咔嚓
1 咔嚓 = 5 硬币
兑换 > 5 咕噜,额外奖励 10 硬币。

例子 1:
输入:小红有 2 个"咕噜币"。
输出:30 个"人类硬币"。

例子 2:
输入:小刚有 4 个"咕噜币"。
输出:60 个"人类硬币"。

问题:小明有 6 个"咕噜币",他能换多少个"人类硬币"?
  • 预期结果: AI 会非常顺从地模仿例子 1 和 2 的简短格式,直接输出 90 个"人类硬币"(或者它计算错误的数字)。
  • 缺陷: 这里的例子太简单(都没触发奖励规则),模型可能会单纯模仿简单的乘法逻辑,从而忽略"额外奖励"的条件,导致算错(6 * 3 * 5 = 90,若是忘了加10,答案就是错的)。

第 3 步:Few-shot + CoT (终极形态:既给例子,又教推理)

这是最强大的技巧。我们在例子里把**思考过程(思维链)**写出来,强迫模型模仿这个思考过程。

请复制以下提示词给 AI:

复制代码
任务:根据外星货币规则计算兑换结果,请展示详细计算逻辑。

规则:
1 咕噜 = 3 咔嚓
1 咔嚓 = 5 硬币
兑换 > 5 咕噜,额外奖励 10 硬币。

例子 1:
输入:小红有 2 个"咕噜币"。
思维过程:
1. 先计算基础兑换:2 咕噜 * 3 = 6 咔嚓。
2. 然后换成硬币:6 咔嚓 * 5 = 30 硬币。
3. 检查奖励条件:2 咕噜没有超过 5,所以没有奖励。
4. 总计:30 硬币。
输出:30 个"人类硬币"。

例子 2:
输入:大壮有 10 个"咕噜币"。
思维过程:
1. 先计算基础兑换:10 咕噜 * 3 = 30 咔嚓。
2. 然后换成硬币:30 咔嚓 * 5 = 150 硬币。
3. 检查奖励条件:10 咕噜超过了 5,需要加上 10 个额外硬币。
4. 总计:150 + 10 = 160 硬币。
输出:160 个"人类硬币"。

问题:小明有 6 个"咕噜币",他能换多少个"人类硬币"?

预期结果: AI 会完美地模仿你的"思维过程"格式:

  • 算出 6 * 3 = 18 咔嚓

  • 算出 18 * 5 = 90 硬币

  • 关键点: 它会显式地写出"6 超过了 5,触发奖励"。

  • 算出 90 + 10 = 100。

    **最终答案:1最终答案:100(正确)。

相关推荐
墨染天姬10 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志11 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_9481142411 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠11 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光11 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好11 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力12 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo12 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_12 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能
枫叶林FYL12 小时前
【自然语言处理 NLP】7.2.2 安全性评估与Constitutional AI
人工智能·自然语言处理