Zero-Shot、One-Shot、Few-Shot 主要归属于提示词工程:
1. Zero-Shot(零样本学习):不提供任何示例,直接问,直接答出整个问题。(一步到位)
-
含义 :模型直接根据给定的指令或问题生成回答,不提供任何示例。它完全依赖预训练时学到的知识和指令理解能力。
-
针对对象:适用于模型已经具备相关知识的通用任务,如翻译、摘要、分类、问答等。测试的是模型的泛化能力和指令遵循能力。
2. One-Shot(单样本学习):给出一个例子,然后给出问题,让他模仿着回答(教一下,一步到位)
-
含义 :在给出指令或问题后,提供一个完整的输入-输出示例,然后让模型对新的输入进行类似处理。
-
针对对象:适用于需要明确输出格式、风格或解决特定类型的问题,但获取大量示例成本较高或不便的场景。通过一个例子让模型"照葫芦画瓢"。
3. Few-Shot(少样本学习)------提供多个案例,然后让模型回答,一步到位
-
含义 :在指令后,提供少量(通常为3-5个)输入-输出示例,然后让模型处理新的输入。
-
针对对象:适用于任务相对复杂或模糊,仅靠指令或一个例子不足以明确边界的情况。多个示例能更好地定义任务,引导模型输出更稳定、更符合期望的结果。
思维链 (CoT / Chain-of-Thought Prompting)------也是一种提示词技术,即让模型一步步思考,而不是直接给出答案(这有利于改进ReAct的思考方式,让其结果更好)
思维链 是一种提示技术 ,它通过要求大语言模型在给出最终答案前,先输出其一步步的推理过程,来显著提升模型在复杂推理任务(如数学问题、逻辑推理、常识问答)上的表现。
一个经典例子:
标准提问: "一个市场有23个苹果,用掉了20个,又买了6个,现在有多少个?"
模型可能直接回答: "6个" (错误)
思维链提问: "一个市场有23个苹果,用掉了20个,又买了6个,现在有多少个?让我们一步步思考。"
模型回答: "首先,最初有23个苹果。用掉20个后,剩下 23 - 20 = 3个苹果。然后,又买了6个,所以现在有 3 + 6 = 9个苹果。所以答案是9。
他可以告诉大模型如何去思考。
ReAct主要归属于RAG领域:
4. ReAct(Reason + Act, 推理与行动):思考-行动 -观察-思考-行动-观察。。。 (循环过程,直到自己将问题一个个拆解回答完整。)
-
含义 :一种让模型**交替进行"推理"和"行动"** 的框架。模型会生成思考链(Reason),然后决定是否需要采取行动(Act),例如调用搜索工具、计算器或代码解释器来获取外部信息,最终综合所有信息给出答案。
-
针对对象:针对需要多步骤推理、知识实时更新或依赖外部工具和计算的复杂任务。例如,回答需要最新数据的问题、解决复杂数学问题、进行深度分析等。它解决了模型固有知识陈旧和复杂计算能力有限的问题。
一个具体案例:回答需要最新信息的问题
用户问题:"特斯拉2025年最新发布的车型是什么?它的主要亮点有哪些?"
一个可能的ReAct执行轨迹:
思考:用户问的是特斯拉2025年的最新车型。我的知识截止到2023年,无法直接回答。我需要查找特斯拉2025年的新车发布信息。
行动:[搜索] 特斯拉 2025 年 新车 发布
观察:搜索结果显示,特斯拉在2025年发布了新款Model 3 Performance,并提到了"狂暴模式"和续航提升。
思考:我找到了车型名称。但用户还问了"主要亮点"。我需要更详细的官方信息来总结亮点。
行动:[搜索] 特斯拉 Model 3 Performance 2025 亮点 官方
观察:官方新闻稿列出了具体亮点:0-60mph加速2.9秒,续航提升至340英里,全新赛道模式。
思考:现在我已经掌握了车型名称和核心亮点,信息足够回答用户的问题了。
最终答案:特斯拉2025年最新发布的车型是新款Model 3 Performance。其主要亮点包括:1) 性能:搭载"狂暴模式",0-60英里加速仅需2.9秒;2) 续航:EPA标准下续航里程提升至340英里;3) 驾驶体验:新增专属赛道模式,提供更极致的操控调校。
| 技术名称 | 核心概念 | 典型应用场景 | 简单示例 |
|---|---|---|---|
| 少样本提示(Few-Shot / K-Shot Prompting) | 提供 K 个输入 - 输出示例,让模型学习任务范式与输出格式,提升小样本任务表现 | 文本分类、实体抽取、风格迁移、代码生成 | 示例 1:输入 "今天天气真好"→情感:积极;示例 2:输入 "真倒霉"→情感:消极;示例 3:输入 "有点累"→情感:? |
| 思维链(CoT / Chain-of-Thought Prompting) | 要求模型分步推理,先展示思考过程再给出最终答案,解决复杂逻辑 / 数学问题 | 数学应用题、逻辑推理、方案拆解、复杂决策分析 | 请一步步分析:某商品原价 100 元,先涨价 10% 再降价 10%,最终价格是多少? |
| 零样本思维链(Zero-Shot CoT) | 无示例情况下,通过自然语言指令引导模型自主分步推理,适配零样本场景 | 陌生领域问答、简单逻辑推导、基础计算题 | 请先分步思考,再回答:一个正方形边长为 5cm,它的周长和面积分别是多少? |
| 自洽性(Self-Consistency) | 让模型对同一问题生成多条推理路径,投票选择最一致的答案,降低随机误差 | 多选推理、数学证明、方案择优、复杂问答 | 请用 3 种不同思路推导这道几何题,最终给出共识结论 |
| 由简至繁 / 最少到最多(Least-to-Most / LtM) | 先解决简单子问题,逐步推进到复杂核心问题,拆解复杂任务难度 | 长文档问答、复杂代码调试、多步骤规划、层级化分析 | 先分析该文档的核心主题,再基于主题拆解关键论点,最后总结核心观点 |
| 思维树(ToT / Tree of Thoughts) | 将问题拆解为多分支推理路径,像树状结构一样探索不同可能性,择优推进 | 创意写作、复杂博弈、方案优化、多目标决策 | 围绕 "科技产品营销",从文案、渠道、活动三个分支构思不同方案,再筛选最优路径 |
| 推理 + 行动(ReAct / Reason + Act) | 融合推理与行动步骤,模型先思考再执行具体操作,衔接知识与实际操作 | 智能体交互、任务自动化、API 调用、实时信息查询 | 请先思考需要查询的信息,再执行搜索操作,最后基于搜索结果回答问题 |
| 程序思维(PoT / Program of Thought) | 引导模型用编程 / 伪代码的方式分步解决问题,将逻辑推理转化为可执行的程序步骤 | 复杂数值计算、算法实现、数据统计分析、流程模拟 | 请用 Python 伪代码实现:计算 1 到 100 的累加和,并输出结果 |
| 反思(Reflexion) | 让模型对输出结果进行自我反思、纠错与优化,提升答案的准确性与完整性 | 写作润色、代码调试、答案校对、方案复盘 | 请先检查这段代码的逻辑漏洞,反思错误原因,再给出修正后的代码 |
| 提示链接 / 链(Prompt Chaining) | 将复杂任务拆解为多个子提示,按顺序依次执行,前序输出作为后序输入 | 长文创作、多轮信息整合、复杂任务流水线、分步优化 | 第一步:提炼核心观点;第二步:基于观点撰写大纲;第三步:根据大纲扩展成完整文章 |
| 生成知识提示(Knowledge Generation Prompting) | 引导模型先生成任务所需的背景知识 / 辅助信息,再基于生成的知识完成目标任务 | 知识匮乏领域问答、创意内容创作、专业领域方案设计 | 请先生成关于 "新能源汽车" 的核心技术知识点,再基于这些知识点撰写产品介绍文案 |
| 系统提示 / 角色设定(System Prompting / Role Prompting) | 在对话开头设定模型的身份、职责、风格与约束,统一模型输出基调 | 定制化客服、专业领域顾问、风格化写作、固定场景交互 | 你是一名资深互联网产品经理,负责撰写产品需求文档,语言需专业、逻辑清晰,严格遵循 PRD 格式 |
| 结构化输出 / 格式化(Structured Output) | 强制模型按指定格式(JSON、表格、列表、步骤等)输出,适配数据对接 / 标准化需求 | API 数据对接、数据提取、报告生成、简历结构化解析 | 请以 JSON 格式输出以下信息:姓名、求职意向、核心技能、项目经验(包含项目名称、职责、成果) |
参考: