[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

Prompt-Learning and Delta-Tunning

背景和概览

但是从T5开始,大模型越来越大了。

微调很难了。

模型的趋势

Model Scaling:模型越来越大

Difficult Tuning:微调越来越难

Prompt-Learning

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。

通过额外增加模版。

映射到标签的过程称为verbalizer。

这样就使用了mask任务。弥补了不同之间的gap。

流程举例

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后

MaskLM有更好的理解能力,mask往往放中间

Encoder-Decoder,mask位置可以随意

Template

人工构造


人为加入规则

结构化的Template
多个template整合
自动template

最终的template可能没有含义,但是work

Verblizer

把标签映射成标签词的过程。

本质上是如何用模型预测得到的分布,用它完成分类或者生成。

人为构造

训练新范式

应用

总结

Delta-Learning

背景与介绍

相关推荐
xuhaoyu_cpp_java2 分钟前
MySql学习(二)
经验分享·笔记·学习·mysql
你叶不叶15 分钟前
sap rap 的技术开发自己的学习路径
学习
厚皮龙18 分钟前
VAE 与世界模型学习总结
学习
小拉达不是臭老鼠18 分钟前
Unity05_3D数学
学习·unity·游戏引擎
冲上云霄的Jayden1 小时前
LangGraph4j+LangChain4J 实验智能客服系统增加基于LLM 解决Prompt注入问题
prompt·agent·智能客服·langchain4j·agent安全·langgraph4j·prompt注入
浅念-1 小时前
从LeetCode入门位运算:常见技巧与实战题目全解析
数据结构·数据库·c++·笔记·算法·leetcode·牛客
talen_hx2961 小时前
《零基础入门Spark》学习笔记 Day 16
笔记·学习·spark
kobesdu1 小时前
【ROS2实战笔记-3】RViz2图形底层与调试暗坑
笔记·机器人·ros·rviz
咬_咬2 小时前
go语言学习(map)
开发语言·学习·golang·map
克里斯蒂亚诺·罗纳尔达2 小时前
智能体学习21——知识检索(RAG)
人工智能·学习·ai