深度对比：Prompt Tuning、P-tuning 与 Prefix Tuning 有何不同？

在大模型（LLM）时代，全量微调（Full Fine-tuning） 已经变得昂贵到令人望而生畏。为了能用更少的算力适配下游任务，参数高效微调（PEFT） 应运而生。

其中，围绕"提示词（Prompt）"做文章的技术路线演进最快。今天我们来聊聊三位主角：Prompt Tuning 、P-tuning 和 Prefix Tuning。它们之间到底有什么血缘关系？

在讨论区别前，必须明确一个共性：这三者都属于 Soft Prompt（软提示）。

由 Google 提出，它的逻辑非常简单：在输入的文本向量（Embedding）前面，强行拼接一段可学习的向量。

清华团队发现，Prompt Tuning 的向量是独立学习的，缺乏逻辑关联，且位置死板。于是他们改进了：

Prefix Tuning 的思想更进一步。它认为：只在输入层加料是不够的，信息传着传着就丢了。

维度	Prompt Tuning	P-tuning (v1)	Prefix Tuning / P-tuning v2
修改位置	仅输入层（最前面）	仅输入层（任意位置）	所有层（深层结构）
参数建模	独立 Embedding	LSTM / MLP 关联编码	多层 Key-Value 拼接
模型适配	依赖超大模型 (10B+)	中小模型表现提升	中小模型也能媲美全量微调
主要用途	简单的生成、分类	NLU（理解类任务）	NLG（生成类任务）及复杂任务

在实际应用中，选择逻辑通常如下：

如果在玩千亿参数的大模型 ：
直接用 Prompt Tuning。因为它简单，且在大规模参数下，简单的 Prefix 拼接就能达到很好的效果。
如果处理的是特定的自然语言理解任务（如 NER、情感分析） ：
P-tuning (v1) 是个好选择，它利用模板的思想能更好地激发模型的潜在知识。
如果追求极致的效果，或者模型规模较小（如 BERT、GPT-2、7B 级别的模型） ：
请直接上 Prefix Tuning 或 P-tuning v2。由于它们在每一层都加入了"辅助信息"，这是目前公认的效果最稳、最接近全量微调的方案。

现在的 PEFT 领域，P-tuning v2 实际上已经吸收了 Prefix Tuning 的精髓，成为了目前工业界处理 NLU 任务最主流的方案之一。