论文略读:Prefix-Tuning: Optimizing Continuous Prompts for Generation

2021 ACL

  • 固定预训练LM,为LM添加可训练,任务特定的前缀
    • 这样就可以为不同任务保存不同的前缀
    • 这种前缀可以看成连续可微的soft prompt,相比于离散的token,更好优化,效果更好
  • 训练的时候只需要更新prefix部分的参数,固定LM部分的参数即可
  • 对于自回归模型,在句子前面添加前缀,得到 z = [PREFIX; x; y]
  • 对于encoder-decoder模型:Encoder和Decoder都增加了前缀,得到 z = [PREFIX; x; PREFIX0; y]
    • Encoder端增加前缀是为了引导输入部分的编码
    • Decoder 端增加前缀是为了引导后续token的生成
    • Prefix-tuning略优于Infix-tuning
      • Infix-tuning形式为 [x; INFIX; y]
      • Prefix-tuning形式为 [PREFIX; x; y]
  • 直接学习参数效果不好,需要使用MLP对Pθ进行reparameter修正
    • Pθ[i,:] = MLP(Pθ'[i,:])
相关推荐
eqwaak07 分钟前
科技信息差(9.2)
开发语言·人工智能·科技·华为·语言模型·开源
乐迪信息8 分钟前
乐迪信息:智慧煤矿视觉检测平台:从皮带、人员到矿车
大数据·人工智能·算法·安全·视觉检测·推荐算法
明月醉窗台12 分钟前
Qt Demo(3) 之 deepseek 帮我写的关于图像显示的小界面
开发语言·人工智能·windows·qt
七夜zippoe36 分钟前
Java 技术支撑 AI 系统落地:从模型部署到安全合规的企业级解决方案(一)
java·人工智能·安全
一碗白开水一43 分钟前
【论文阅读】Sparse4D v3:Advancing End-to-End 3D Detection and Tracking
论文阅读·人工智能·目标检测·3d·自动驾驶
信息快讯1 小时前
光学神经网络与人工智能应用
人工智能·深度学习·神经网络
CoovallyAIHub1 小时前
突破闭集限制:3D-MOOD 实现开集单目 3D 检测新 SOTA
深度学习·算法·计算机视觉
MiaoChuAI1 小时前
新手也能轻松选!秒出PPT和豆包AI PPT优缺点解析
人工智能·powerpoint
迪娜学姐1 小时前
GPT-5论文选题实测:如何从2000篇文献中提炼出3个可快速落地的高命中选题?
人工智能·gpt·chatgpt·prompt·论文笔记
AiTop1001 小时前
腾讯混元世界模型Voyager开源:单图生成3D世界的“核弹级”突破,游戏、VR、自动驾驶迎来新变量
人工智能·游戏·3d·aigc·vr