第四章:大模型(LLM)】07.Prompt工程-(3)Few-shot Prompt

第四章:大模型(LLM)

第七部分:Prompt 工程

第三节:Few-shot Prompt


1. 什么是 Few-shot Prompt

Few-shot Prompt(少样本提示) 是指在 Prompt 中为模型提供 几个示例,让模型通过这些示例理解任务模式和输出格式,从而提高生成结果的准确性和一致性。

  • Zero-shot:不给示例,仅靠指令。

  • One-shot:只给 1 个示例。

  • Few-shot:给出多个示例(通常 2~5 个)。

例如:

Prompt:

bash 复制代码
请将以下中文翻译成英文:  
示例:  
中文:你好 → 英文:Hello  
中文:早上好 → 英文:Good morning  
中文:谢谢 → 英文:Thank you  

现在请翻译:  
中文:我喜欢人工智能

模型输出:

复制代码
英文:I like artificial intelligence

在这个例子中,模型通过前面提供的几个"中英文对应示例"理解了任务规则,从而生成格式正确的结果。


2. Few-shot Prompt 的原理

Few-shot Prompt 的核心思想是:

  • 提供模式(Pattern):示例告诉模型"任务怎么做"。

  • 减少歧义(Ambiguity):避免模型输出偏离目标。

  • 提升一致性(Consistency):输出格式和风格更稳定。

可以理解为:

Few-shot = 给模型几次"演示",让它照葫芦画瓢。


3. Few-shot Prompt 的应用场景
  1. 文本分类

    • Prompt:

      复制代码
      请将评论分类为"积极"或"消极":  
      示例:  
      评论:这部电影非常精彩! → 积极  
      评论:这家餐厅的服务太差了。 → 消极  
      
      评论:手机的电池续航还不错。 →
    • 模型输出:积极

  2. 格式化信息抽取

    • Prompt:

      复制代码
      请从以下句子中抽取人名和地点,输出 JSON:  
      示例:  
      句子:李雷在北京工作。  
      输出:{"人名": "李雷", "地点": "北京"}  
      
      句子:小王正在上海学习。  
      输出:
    • 模型输出:{"人名": "小王", "地点": "上海"}

  3. 文本风格模仿

    • Prompt:

      复制代码
      请模仿示例写句子:  
      示例:春风拂面,柳絮飞扬。  
      示例:夏雨骤来,荷花初开。  
      
      现在请写一句关于秋天的句子。
    • 模型输出:秋叶飘落,稻谷金黄。


4. Few-shot Prompt 的优势
  1. 提高准确性:示例减少了模型的误解空间。

  2. 增强可控性:可通过示例控制输出格式。

  3. 更好迁移性:适用于复杂、专业任务(如医疗、法律等领域)。

  4. 灵活定制:通过选择不同的示例,可以影响风格或格式。


5. Few-shot Prompt 的局限性
  1. Token 消耗增加

    • 每个示例都会占用模型上下文窗口。
  2. 示例依赖性强

    • 示例的质量决定输出效果。

    • 如果示例含糊或错误,模型会跟着出错。

  3. 不适合超复杂任务

    • 当任务需要大量训练才能掌握时,Few-shot 可能不足以支撑。

6. 设计 Few-shot Prompt 的技巧
  1. 挑选典型示例:示例应覆盖主要情况。

  2. 保持格式一致:示例输出必须规范、统一。

  3. 避免冗长:控制示例数量,通常 2~5 个最佳。

  4. 逐渐扩展:先用 Zero-shot 验证,再加入 Few-shot 优化。


7. 案例演示

任务:句子情感分类

  • Few-shot Prompt:

    复制代码
    请判断以下评论是积极还是消极:  
    示例:  
    评论:这家餐厅太棒了! → 积极  
    评论:这部电影很糟糕。 → 消极  
    评论:手机的外观很好看。 → 积极  
    
    评论:客服态度非常差。 →
  • 模型输出:

    复制代码
    消极

8. 小结
  • Few-shot Prompt 通过示例帮助模型理解任务和格式。

  • 相比 Zero-shot,它能显著提升准确性和一致性。

  • 应用广泛:分类、抽取、翻译、风格模仿、代码生成。

  • 关键技巧:示例典型、格式统一、数量适中

在下一节中,我们将深入学习 Chain-of-Thought Prompt(思维链提示),它能帮助模型完成更复杂的推理和多步骤任务。