论文略读:Prefix-Tuning: Optimizing Continuous Prompts for Generation

2021 ACL

  • 固定预训练LM,为LM添加可训练,任务特定的前缀
    • 这样就可以为不同任务保存不同的前缀
    • 这种前缀可以看成连续可微的soft prompt,相比于离散的token,更好优化,效果更好
  • 训练的时候只需要更新prefix部分的参数,固定LM部分的参数即可
  • 对于自回归模型,在句子前面添加前缀,得到 z = [PREFIX; x; y]
  • 对于encoder-decoder模型:Encoder和Decoder都增加了前缀,得到 z = [PREFIX; x; PREFIX0; y]
    • Encoder端增加前缀是为了引导输入部分的编码
    • Decoder 端增加前缀是为了引导后续token的生成
    • Prefix-tuning略优于Infix-tuning
      • Infix-tuning形式为 [x; INFIX; y]
      • Prefix-tuning形式为 [PREFIX; x; y]
  • 直接学习参数效果不好,需要使用MLP对Pθ进行reparameter修正
    • Pθ[i,:] = MLP(Pθ'[i,:])
相关推荐
VBsemi-专注于MOSFET研发定制几秒前
面向AI管道检测机器人的功率MOSFET选型分析——以高集成度、高可靠电源与驱动系统为例
人工智能·单片机·机器人
liu_zhiyi几秒前
Andrej Karpathy Skills:AI 智能体编程四项原则 介绍及扩展
人工智能·prompt
步步为营DotNet2 分钟前
LM-Kit.NET:.NET 生态一站式本地 AI 开发平台
人工智能·.net
市象4 分钟前
MiniMax不需要讨好开源
人工智能
John_ToDebug4 分钟前
从“会调用”到“稳得住”:Agent工具使用与MCP安全交互深度剖析
人工智能·ai agent
老王谈企服5 分钟前
2026金融数字化转型:金融数据不能出内网,Agent必须私有化部署,有什么信创适配的产品?
人工智能·ai·金融
skywalk81638 分钟前
‌Mew.Design‌ 的AI设计平台 介绍
人工智能
byte轻骑兵8 分钟前
【HID】规范精讲[3]: 蓝牙HID协议消息详解——无线交互的数据传输语言
人工智能·人机交互·蓝牙·键盘·hid
nebula-AI9 分钟前
llm wiki的固定提示词
人工智能·ai·个人开发·ai编程
袁牛逼9 分钟前
crm外呼系统,人工外呼软件,电销防F号专用
人工智能·外呼