[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

Prompt-Learning and Delta-Tunning

背景和概览

但是从T5开始,大模型越来越大了。

微调很难了。

模型的趋势

Model Scaling:模型越来越大

Difficult Tuning:微调越来越难

Prompt-Learning

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。

通过额外增加模版。

映射到标签的过程称为verbalizer。

这样就使用了mask任务。弥补了不同之间的gap。

流程举例

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后

MaskLM有更好的理解能力,mask往往放中间

Encoder-Decoder,mask位置可以随意

Template

人工构造


人为加入规则

结构化的Template
多个template整合
自动template

最终的template可能没有含义,但是work

Verblizer

把标签映射成标签词的过程。

本质上是如何用模型预测得到的分布,用它完成分类或者生成。

人为构造

训练新范式

应用

总结

Delta-Learning

背景与介绍

相关推荐
chudonghao32 分钟前
[UE学习笔记][基于源码] 理解 Gameplay
c++·笔记·学习·ue5
Nan_Shu_6141 小时前
学习:Cesium (4)
前端·学习
炽烈小老头1 小时前
【 每天学习一点算法 2026/03/25】在排序数组中查找元素的第一个和最后一个位置
学习·算法
西西弗Sisyphus1 小时前
LangChain 动态 prompt
langchain·prompt
movigo7_dou2 小时前
关于光与重建方法的学习3.25
学习
AI-Ming2 小时前
程序员转行学习AI大模型:位置编码
人工智能·神经网络·学习
左左右右左右摇晃2 小时前
数据结构——数组
数据结构·笔记·算法
nainaire2 小时前
速通LeetCode hot100——(1~9 哈希,双指针,滑动窗口)
c++·笔记·算法·leetcode
hmbbcsm2 小时前
动手学习深度学习学习笔记(一)
笔记·学习
春水碧于天,画船听雨眠2 小时前
jQuery学习笔记
笔记·学习·jquery