Few-shot Learning 少样本学习(大模型领域精简版)
核心定义
少样本学习 :仅提供少量标注示例 (通常 1~10 组输入输出样例),模型无需更新参数、不用专项训练,仅凭示例理解任务规则并完成推理,是大模型上下文学习的核心形式。
三类主流范式对比(AI 最常用)
-
Zero-shot 零样本不给任何样例,只靠自然语言指令执行任务。例:直接说 "把这句话翻译成英文",无参考例句。
-
Few-shot 少样本 给少量样例(1~10 个)辅助模型对齐规则,效果远优于零样本。例:附上 2 组中英对照例句,再让模型翻译新句子。
-
Many-shot 多样本给出几十 / 上百个样例,介于少样本和全量训练之间。
补充:Fine-tune(微调) 和三者本质不同:会用大量数据修改模型权重,属于真正的 "重新训练",成本更高、落地流程更复杂。
工作原理(大白话)
大模型在预训练阶段已经掌握海量语言模式、逻辑和任务范式。你在提示词里放入几组样例,模型会在单次推理的上下文 中总结规律、模仿格式与逻辑,全程参数不变,仅临时适配当前任务。
典型 Prompt 结构模板
plaintext
任务说明:[描述要做什么]
示例1:
输入:xxx
输出:xxx
示例2:
输入:xxx
输出:xxx
请处理新内容:
输入:[你的内容]
输出:
优缺点
- 优点:上手快、零训练成本、灵活改任务、部署简单
- 缺点:样例质量影响结果极大;复杂推理、小众任务效果易下滑;超长任务受上下文窗口限制