论文略读：Prefix-Tuning: Optimizing Continuous Prompts for Generation

UQI-LIUWJ2025-07-11 14:18

2021 ACL

固定预训练LM，为LM添加可训练，任务特定的前缀
- 这样就可以为不同任务保存不同的前缀
- 这种前缀可以看成连续可微的soft prompt，相比于离散的token，更好优化，效果更好
训练的时候只需要更新prefix部分的参数，固定LM部分的参数即可

对于自回归模型，在句子前面添加前缀，得到 z = [PREFIX; x; y]

对于encoder-decoder模型：Encoder和Decoder都增加了前缀，得到 z = [PREFIX; x; PREFIX0; y]
- Encoder端增加前缀是为了引导输入部分的编码
- Decoder 端增加前缀是为了引导后续token的生成
- Prefix-tuning略优于Infix-tuning
  - Infix-tuning形式为 [x; INFIX; y]
  - Prefix-tuning形式为 [PREFIX; x; y]
直接学习参数效果不好，需要使用MLP对Pθ进行reparameter修正
- Pθ[i,:] = MLP(Pθ'[i,:])

上一篇：【算法训练营Day11】二叉树part1

下一篇：🪄 这么优雅？`useContext` + 自定义 Hooks：优雅管理全局状态，从主题切换说起

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05Window 10部署openclaw报错node.exe : npm error code 128 06OpenClaw优化飞书API 额度已耗尽问题 07本地部署 OpenClaw + DeepSeek-R1 完全指南 08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09网站改了域名，如何查找？10小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）