【第十九周】自然语言处理的学习笔记04

文章目录

摘要
Abstract
一、自然语言处理
- [1. 预训练-微调](#1. 预训练-微调)
- - [1.1 BERT](#1.1 BERT)
  - [1.2 GPT](#1.2 GPT)
  - [1.3 微调优化](#1.3 微调优化)
- [2. prompt learning](#2. prompt learning)
- - [2.1 Template（模板）](#2.1 Template（模板）)
  - [2.2 Verbalizer（表述器）](#2.2 Verbalizer（表述器）)
  - [2.3 Template与Verbalizer 核心关联](#2.3 Template与Verbalizer 核心关联)
  - [2.4 Template和Verbalizer的构造](#2.4 Template和Verbalizer的构造)
  - [2.5 优化预训练](#2.5 优化预训练)
- [3. delta tuning](#3. delta tuning)
- - [3.1 Delta learning三种类别](#3.1 Delta learning三种类别)
  - [3.2 delta tuning相关说明](#3.2 delta tuning相关说明)
- [4. OpenPrompt](#4. OpenPrompt)
- - [4.1 API的设计及工作流程](#4.1 API的设计及工作流程)
  - [4.2 常用template汇总：](#4.2 常用template汇总：)
总结

摘要

本周主要学习大模型微调的优化方法------prompt learning和delta tuning。Prompt learning学习了其核心组成template和verbalizer和它们的构造，还学习了将prompt learning融入预训练实现对预训练的优化。Delta tuning学习了含有的三种类别以及delta tuning的优势。

最后还学习了prompt learning的工具包OpenPrompt。了解OpenPrompt的api设计结构。工作流程以及常用template。

Abstract

This week, I mainly learned about the optimization methods for large model fine-tuning: prompt learning and delta tuning. In prompt learning, I studied its core components---templates and verbalizers, as well as their construction. I also learned how to integrate prompt learning into pre-training to optimize the pre-training process. In delta tuning, I learned about its three categories and the advantages of delta tuning.

Finally, I studied OpenPrompt, a toolkit for prompt learning, including understanding its API design structure, workflow, and commonly used templates.

一、自然语言处理

1. 预训练-微调

预训练Pre-training搭建通用能力基础，微调 Fine-tuning适配具体任务需求。

1.1 BERT

微调

1，字符级别任务

无论输入句子数量的多少，会对每个字符token产生一个表示representation，并对representation进行分类。

例如，对token进行分类，判断一个token是上下文还是一个实体，因此会将token的representation送入一个额外分类层，实现对每一个token的分类。

2，句子级别任务

4.2 常用template汇总：

A：主题分类的硬提示

" a {"mask"} news: {"meta": "title"} {"meta": "description"} "

任务是 "新闻主题分类"，模板结构为 "a {mask} news: [新闻标题] [新闻描述]"。

具体举例：输入标题："苹果发布新款 iPhone"；描述："搭载 A17 芯片，支持 5G"，模板会生成 "a {mask} news: 苹果发布新款 iPhone 搭载 A17 芯片，支持 5G"，模型需预测{mask}处的主题（如 "科技"）。

B：实体类型识别的硬提示

" {"meta": "sentence"}. In this sentence, {"meta": "entity"} is a {"mask"} "

任务：识别句子中实体的类型（如 "人名""地名""机构名"）。

具体举例：句子 "马云在杭州创办了阿里巴巴"、实体 "马云"，模板生成 "马云在杭州创办了阿里巴巴. In this sentence, 马云 is a {mask}"，模型需预测{mask}为 "人名"。

C：基于文本令牌初始化的软提示

" {"meta": "premise"} {"meta": "hypothesis"} {"soft": "Does the first sentence entails the second ?"} {"mask"} {"soft"}. "

任务：自然语言推理（判断前提是否蕴含假设）。

说明：{"meta": "premise"}和{"meta": "hypothesis"}填入 "前提句" 和 "假设句"；{"soft": "..."}是初始化的软提示向量（由文本 "Does the first sentence entails the second ?" 转化而来）。模型需在{mask}处预测推理结果（如 "entails""contradicts""neutral"），软提示向量会在训练中被优化，以更精准地引导推理任务。

具体举例：前提："A man is playing a guitar."（一个男人在弹吉他）；假设："A person is making music."（一个人在制作音乐），模型的目标是预测[mask向量]处的输出，即 "Entails"（因为弹吉他属于制作音乐，前提蕴含假设）。

D：规模的力量

" {"soft": None, "duplicate": 100} {"meta": "text"} {"mask"} "

说明：任务可理解为 "文本分类或生成"，将输入文本{"meta": "text"}重复 100 次后输入模型，借助大模型对长上下文的建模能力提升任务性能（如分类准确性）。

E：后处理脚本支持

" {"meta": "context", "post_processing": lambda s: s.rstrip(string.punctuation)}. {"soft": "It was"} {"mask"} "

后处理：对模型输出进行格式优化，此处是 "去除结尾标点"。

说明：{"meta": "context"}填入上下文文本；post_processing指定一个 lambda 函数，对输出结果去除结尾标点（如将 "great!" 处理为 "great"）。软提示{"soft": "It was"}引导模型生成后续内容（如 "a good day"），后处理确保输出格式整洁。

补充：post-processing（后处理）

作用：优化模型输出的 "最后一公里"

Post-processing 是指在模型生成结果后，对输出进行修正、优化或格式调整，以提升结果的准确性、可读性和实用性。它是弥补模型缺陷（如重复生成、格式混乱、逻辑矛盾）的关键步骤。

主要功能：

1，重复惩罚（Repetition Penalty）

大模型在生成文本时容易陷入 "循环生成"（如连续输出 "很好很好很好..."）。后处理通过降低已生成词的概率来避免重复。

2，格式标准化与结构化提取

模型生成的文本可能格式混乱（如日期、列表无规范结构），后处理通过规则或工具将其转换为统一格式。

3，逻辑一致性校验（RAG 系统常见）

在检索增强生成（RAG）中，模型可能生成与检索知识矛盾的 "幻觉" 内容。后处理通过自然语言推理（NLI）模型判断生成答案与知识的一致性。

4，敏感内容过滤

对生成文本中的政治、暴力等违规内容进行拦截，保障应用安全性。

F：共享软令牌的混合提示

混合提示：结合硬文本和软令牌，且多个软令牌共享参数（soft_id相同表示共享）。

" {"meta": "premise"} {"meta": "hypothesis"} {"soft": "Does"} {"soft": "the", "soft_id": 1} first sentence entails {"soft_id": 1} second? "

说明：任务仍是自然语言推理，模板中 "Does" 是硬文本，"the" 是软令牌且soft_id=1（表示该软令牌在 "first sentence entails {soft_id:1} second?" 中共享，即两处 "the" 的向量参数相同）。这种设计减少了待训练的软令牌数量，提升训练效率。

补充：soft token

Soft token：可训练的连续向量（而非人工设计的离散文本）。例如，为情感分析任务设计一组可学习的向量作为提示，模型通过训练优化这些向量，使其能精准引导输出 "正面" 或 "负面" 类别。

实现方式：用 PyTorch 的nn.Embedding层初始化一组向量，与输入文本的词嵌入拼接后输入大模型，训练时仅更新这组向量。

Soft token的选择：

"Soft"的选择（包括初始化方式、长度、优化策略等）直接影响模型性能。

1.初始化：优先用文本令牌初始化，小数据必选，大数据可尝试随机初始化。

补充：

文本令牌初始化：用自然语言文本（如任务描述、指令）的词向量作为初始软提示。例如，情感分析任务用文本"判断这句话的情感是："的词向量初始化。

2.长度：从8-20 个向量起步，根据过拟合 / 欠拟合调整。

3.优化：资源有限时仅优化软提示，数据充足时联合优化顶层参数，学习率设为 1e-4 ~ 5e-3。

4.位置：优先前缀位置，生成式任务可尝试后缀。

5.混合策略：复杂任务建议结合硬提示文本，提升引导效果。

G：指定标题不被截断

" a {"mask"} news: {"meta": "title", "shortenable": False} {"meta": "description"} "

注意：指定 "标题" 字段在输入时不被截断（保持完整）。

说明：与示例 A 类似，但{"meta": "title", "shortenable": False}确保新闻标题在填入模板时不会因长度限制被截断，保证输入信息的完整性，从而提升分类准确性。

总结

本周对于prompt learning的学习还未加入代码部分，因此下周将加入代码学习。