few‑shot learning(少样本学习)

Few-shot Learning 少样本学习(大模型领域精简版)

核心定义

少样本学习 :仅提供少量标注示例 (通常 1~10 组输入输出样例),模型无需更新参数、不用专项训练,仅凭示例理解任务规则并完成推理,是大模型上下文学习的核心形式。

三类主流范式对比(AI 最常用)

  1. Zero-shot 零样本不给任何样例,只靠自然语言指令执行任务。例:直接说 "把这句话翻译成英文",无参考例句。

  2. Few-shot 少样本少量样例(1~10 个)辅助模型对齐规则,效果远优于零样本。例:附上 2 组中英对照例句,再让模型翻译新句子。

  3. Many-shot 多样本给出几十 / 上百个样例,介于少样本和全量训练之间。

补充:Fine-tune(微调) 和三者本质不同:会用大量数据修改模型权重,属于真正的 "重新训练",成本更高、落地流程更复杂。

工作原理(大白话)

大模型在预训练阶段已经掌握海量语言模式、逻辑和任务范式。你在提示词里放入几组样例,模型会在单次推理的上下文 中总结规律、模仿格式与逻辑,全程参数不变,仅临时适配当前任务。

典型 Prompt 结构模板

plaintext

复制代码
任务说明:[描述要做什么]
示例1:
输入:xxx
输出:xxx

示例2:
输入:xxx
输出:xxx

请处理新内容:
输入:[你的内容]
输出:

优缺点

  • 优点:上手快、零训练成本、灵活改任务、部署简单
  • 缺点:样例质量影响结果极大;复杂推理、小众任务效果易下滑;超长任务受上下文窗口限制
相关推荐
ZhengEnCi44 分钟前
09c-斯坦福CS336作业二:系统与分布式训练
人工智能
阿里云大数据AI技术1 小时前
用 SQL 解锁多模态数据分析:Hologres 让图片、语音、视频变成结构化洞察
人工智能
阿里云大数据AI技术1 小时前
EMR Serverless StarRocks 湖仓多模态检索:One SQL on One Data,实现全文 + 标量 + 向量三路混合检索
人工智能
冬奇Lab3 小时前
Skill 系列(02):Skill 安全风险——三类攻击面的实战测试
人工智能·安全·开源
冬奇Lab3 小时前
每日一个开源项目(第138篇):OpenMontage - 把 AI 编程助手变成完整的视频制作团队
人工智能·开源·claude
米小虾3 小时前
智谱港股盘中市值突破万亿港元!GLM-5.2 开源引爆国产 AI 价值重估
人工智能·chatglm (智谱)
阿里云大数据AI技术3 小时前
义乌小商品城基于MaxFrame AI Function的亿级AI 数据产线提速之路
人工智能
甲维斯4 小时前
用AI还原《坦克大战》并3D化升级!
前端·人工智能·游戏开发
IT_陈寒5 小时前
SpringBoot自动配置坑了我一晚上,原来问题出在这
前端·人工智能·后端