[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

Prompt-Learning and Delta-Tunning

背景和概览

但是从T5开始,大模型越来越大了。

微调很难了。

模型的趋势

Model Scaling:模型越来越大

Difficult Tuning:微调越来越难

Prompt-Learning

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。

通过额外增加模版。

映射到标签的过程称为verbalizer。

这样就使用了mask任务。弥补了不同之间的gap。

流程举例

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后

MaskLM有更好的理解能力,mask往往放中间

Encoder-Decoder,mask位置可以随意

Template

人工构造


人为加入规则

结构化的Template
多个template整合
自动template

最终的template可能没有含义,但是work

Verblizer

把标签映射成标签词的过程。

本质上是如何用模型预测得到的分布,用它完成分类或者生成。

人为构造

训练新范式

应用

总结

Delta-Learning

背景与介绍

相关推荐
cmes_love10 分钟前
Level 2逐笔成交历史数据下载方法笔记
数据库·笔记·oracle
马士兵教育14 分钟前
Java还有前景吗?Java+AI大模型学习路线及项目?
java·人工智能·python·学习·机器学习
Cloud_Shy6181 小时前
解读《Effective Python 3rd Edition》:从练气到老魔(第五章 Item 30 - 32)
开发语言·人工智能·笔记·python·学习方法
lizhihai_991 小时前
股市学习心得-AI 产业链核心标的梳理清单
大数据·服务器·人工智能·科技·学习
问心无愧05131 小时前
ctf show web入门110
前端·笔记
吃好睡好便好2 小时前
说说科学爬山
学习·生活
道一232 小时前
Windows系统查看端口占用进程的3种实用方法
windows·笔记
键盘侠伍十七2 小时前
Gandalf Lakera AI Prompt Injection 靶场深度教程:从 Level 1 到 Level 8 全面攻防解析
人工智能·prompt·ai安全
lunzi_08262 小时前
【学习笔记】《Python编程 从入门到实践》第8章:函数定义、参数传递与模块导入
笔记·python·学习
零陵上将军_xdr3 小时前
后端转全栈学习-Day5-JavaScript 基础-3
开发语言·javascript·学习