论文略读:Prefix-Tuning: Optimizing Continuous Prompts for Generation

2021 ACL

  • 固定预训练LM,为LM添加可训练,任务特定的前缀
    • 这样就可以为不同任务保存不同的前缀
    • 这种前缀可以看成连续可微的soft prompt,相比于离散的token,更好优化,效果更好
  • 训练的时候只需要更新prefix部分的参数,固定LM部分的参数即可
  • 对于自回归模型,在句子前面添加前缀,得到 z = [PREFIX; x; y]
  • 对于encoder-decoder模型:Encoder和Decoder都增加了前缀,得到 z = [PREFIX; x; PREFIX0; y]
    • Encoder端增加前缀是为了引导输入部分的编码
    • Decoder 端增加前缀是为了引导后续token的生成
    • Prefix-tuning略优于Infix-tuning
      • Infix-tuning形式为 [x; INFIX; y]
      • Prefix-tuning形式为 [PREFIX; x; y]
  • 直接学习参数效果不好,需要使用MLP对Pθ进行reparameter修正
    • Pθ[i,:] = MLP(Pθ'[i,:])
相关推荐
图欧学习资源库10 分钟前
人工智能领域、图欧科技、IMYAI智能助手2025年6月更新月报
人工智能·科技
聚客AI35 分钟前
✅掌握ReAct=掌控AI代理灵魂:从工具调用、循环架构到生产级优化
人工智能·llm·掘金·日新计划
bright_colo38 分钟前
Python-初学openCV——图像预处理(七)——亮度变换、形态学变换
人工智能·opencv·计算机视觉
CODE_RabbitV1 小时前
如何让 RAG 检索更高效?——大模型召回策略全解
人工智能·算法·机器学习
一点一木1 小时前
PromptPilot 与豆包新模型:从图片到视频,解锁 AI 新玩法
前端·人工智能
盼小辉丶1 小时前
TensorFlow深度学习实战(28)——扩散模型(Diffusion Model)
深度学习·tensorflow·生成模型
aneasystone本尊1 小时前
实战 Coze Studio 智能体开发
人工智能
max5006001 小时前
复现论文《A Fiber Bragg Grating Sensor System for Train Axle Counting》
开发语言·python·深度学习·机器学习·matlab·transformer·机器翻译
无规则ai1 小时前
数字图像处理(冈萨雷斯)第三版:第四章——频率域滤波(学前了解知识)——主要内容和重点
人工智能·算法·机器学习·计算机视觉