论文阅读笔记——Adapter,AdapterFusion,AdapterDropAdapter 论文 Adapter 是一组轻量级的参数,被添加到模型的中间层,以保护原有预训练模型的参数。 Adapter:少量参数和近似恒等初始化。注意:仍然增加了网络深度!!! Adapter模块由两个前馈子层构成。第一个子层接收 Transformer 块的输出,并将原始输入维度 d 映射到较小的维度 m(通常m远小于d),以此限制模块的参数量。第二个子层则负责将维度m重新映射回d,作为模块的最终输出。这种设计使得 Adapter 模块能够在不调整整个模型参数的情况下,灵活适应新的下游任务,有效避