[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

Prompt-Learning and Delta-Tunning

背景和概览

但是从T5开始,大模型越来越大了。

微调很难了。

模型的趋势

Model Scaling:模型越来越大

Difficult Tuning:微调越来越难

Prompt-Learning

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。

通过额外增加模版。

映射到标签的过程称为verbalizer。

这样就使用了mask任务。弥补了不同之间的gap。

流程举例

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后

MaskLM有更好的理解能力,mask往往放中间

Encoder-Decoder,mask位置可以随意

Template

人工构造


人为加入规则

结构化的Template
多个template整合
自动template

最终的template可能没有含义,但是work

Verblizer

把标签映射成标签词的过程。

本质上是如何用模型预测得到的分布,用它完成分类或者生成。

人为构造

训练新范式

应用

总结

Delta-Learning

背景与介绍

相关推荐
U盘失踪了3 小时前
【笔记】Flask 用 session 对象存储用户状态
笔记
Aision_4 小时前
Agent 为什么需要 Checkpoint?
人工智能·python·gpt·langchain·prompt·aigc·agi
Brilliantwxx5 小时前
【C++】 vector(代码实现+坑点讲解)
开发语言·c++·笔记·算法
百锦再5 小时前
Auto.js变成基础知识学习
开发语言·javascript·学习·sqlite·kotlin·android studio·数据库开发
KuaCpp6 小时前
C++新特性学习
c++·学习
Komorebi_99998 小时前
大模型学习day5
学习·大模型
逍遥德9 小时前
AI时代,计算机专业大学生学习指南
java·javascript·人工智能·学习·ai编程
网络与设备以及操作系统学习使用者9 小时前
直连路由优先级最高
运维·网络·学习·华为·智能路由器
码途漫谈10 小时前
Easy-Vibe高级开发篇阅读笔记(五)——CC教程之Agent Teams
人工智能·笔记·ai·开源·ai编程
逆羽飘扬10 小时前
【AI Infra面试】基础学习汇总篇
人工智能·学习