大模型微调--文章3

原文地址

链接:https://zhuanlan.zhihu.com/p/635848732

思考题

问题1:p-tuning为了解决什么问题?(解决)

答案:该方法的提出主要是为了解决这样一个问题:大模型的Prompt构造方式严重影响下游任务的效果。比如:GPT-3采用人工构造的模版来做上下文学习(in context learning),但人工设计的模版的变化特别敏感,加一个词或者少一个词,或者变动位置都会造成比较大的变化。

问题2:什么是NLU任务?(解决)

答案:自然语言理解,是自然语言处理(NLP)中的一个重要子领域,涉及理解和处理人类语言的语义和语法,以便机器能够从文本中提取有意义的信息。NLU任务通常涉及对文本的深层次理解,包括解析句子结构、理解上下文、推理隐含意义。

问题3:什么是P-tuning?与prefix tuning有什么区别?(解决)

答案:prefix tuning是在每一层中插入可学习的前缀嵌入序列,而不是直接影响输入,在transformer每一层都添加前缀;

p-tuning是直接在输入层中插入可学习的提示词(软提示),优化这些提示词以提高任务性能,仅在输入层进行更改,在其他层没有操作。

问题4:P-tuning v2的原理是怎么样的?(解决)

答案:P-tuning v2不仅仅在输入层添加软提示,还可以在模型的多个中间层或特定层添加这些提示。这种多层次的提示优化使得模型能够更好地捕捉复杂的语义信息。

问题5:prompt-tunin、prefix tuning、p-tuning和p-tuning2有什么区别和联系?(解决)

答案:p-tuning可以看作是prompt-tunin的发展;p-tuning2可以看作是prefix tuning的发展

问题6:文章主要讲了什么内容?文章结构是什么样的?(解决)

答案:文章主要讲了p-tuning和p-tuning是什么,以及原理是什么,和前一篇的对比。结构上也是这样的。

动手题

1:动手实践prompt-tuning、prefix tuning、p-tuning和p-tuning v2(未解决)

相关推荐
2501_94219177几秒前
基于YOLOv5-RepHGNetV2的青椒目标检测方法研究原创
人工智能·yolo·目标检测
余醉 | dtminer7 分钟前
R语言常见新手问题
开发语言·r语言
それども10 分钟前
为什么要加@ResponseBody
java·开发语言·spring boot
wukangjupingbb11 分钟前
从英矽智能与晶泰科技在港股的上市看目前中国AI制药研发的趋势以及竞争态势
人工智能·科技
Jack___Xue17 分钟前
LLM知识随笔(一)--Transformer
人工智能·深度学习·transformer
一只专注api接口开发的技术猿22 分钟前
微服务架构下集成淘宝商品 API 的实践与思考
java·大数据·开发语言·数据库·微服务·架构
AC赳赳老秦28 分钟前
Dify工作流+DeepSeek:运维自动化闭环(数据采集→报告生成)
android·大数据·运维·数据库·人工智能·golang·deepseek
被星1砸昏头29 分钟前
C++中的享元模式
开发语言·c++·算法
Deepoch29 分钟前
Deepoc具身模型:清洁机器人的智能决策引擎
人工智能·机器人·生活·开发板·清洁机器人·具身模型·deepoc
2501_9444241232 分钟前
Flutter for OpenHarmony游戏集合App实战之记忆翻牌配对消除
android·java·开发语言·javascript·windows·flutter·游戏