[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

Prompt-Learning and Delta-Tunning

背景和概览

但是从T5开始,大模型越来越大了。

微调很难了。

模型的趋势

Model Scaling:模型越来越大

Difficult Tuning:微调越来越难

Prompt-Learning

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。

通过额外增加模版。

映射到标签的过程称为verbalizer。

这样就使用了mask任务。弥补了不同之间的gap。

流程举例

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后

MaskLM有更好的理解能力,mask往往放中间

Encoder-Decoder,mask位置可以随意

Template

人工构造


人为加入规则

结构化的Template
多个template整合
自动template

最终的template可能没有含义,但是work

Verblizer

把标签映射成标签词的过程。

本质上是如何用模型预测得到的分布,用它完成分类或者生成。

人为构造

训练新范式

应用

总结

Delta-Learning

背景与介绍

相关推荐
无涯学徒199828 分钟前
G1学习打卡
学习
要天天开心啊42 分钟前
mybatis的第五天学习笔记
笔记·学习·mybatis
阿超爱嵌入式1 小时前
STM32学习之ARM内核自带的中断
arm开发·stm32·学习
切图只会helloworld1 小时前
SpringBoot基本教程
笔记
受之以蒙1 小时前
Rust 宏全解析:从基础到实战,掌握代码生成魔法
前端·笔记·rust
互联网上的猪1 小时前
excel常见错误包括(#N/A、#VALUE!、#REF!、#DIV/0!、#NUM!、#NAME?、#NULL! )
笔记·学习·excel
XYN612 小时前
【嵌入式学习6】多任务版TCP服务器
服务器·网络·笔记·python·网络协议·学习·tcp/ip
吴梓穆2 小时前
UE5学习笔记 FPS游戏制作44 统一UI大小 sizeBox
笔记·学习·ue5
Three~stone2 小时前
MySQL学习笔记集--触发器
笔记·学习·mysql
Jyywww1213 小时前
Vue2+Vue3 45-90集学习笔记
vue.js·学习