Mindspore 公开课 - prompt

coyote_xujie2024-01-16 23:27

prompt 介绍

Fine-Tuning to Prompt Learning

Pre-train, Fine-tune

BERT

bidirectional transformer，词语和句子级别的特征抽取，注重文本理解
Pre-train: Maked Language Model + Next Sentence Prediction
Fine-tune: 根据任务选取对应的representation（最后一层hidden state输出），放入线性层中

例：Natural Language Inference

Pre-train, Fine-tune: models

BERT
- bidirectional transformer，词语和句子级别的特征抽取，注重文本理解
- Pre-train: Maked Language Model + Next Sentence Prediction
- Fine-tune: 根据任务选取对应的representation（最后一层hidden state输出），放入线性层中
  例：Named Entity Recognition

Pre-train, Fine-tune: models

GPT
- auto-regressive model，通过前序文本预测下一词汇，注重文本生成
- Pre-train: L 1 ( U ) = ∑ i log ⁡ P ( u i ∣ u i − k , ... , u i − 1 ; Θ ) L_1(\mathcal{U})=\sum_i \log P\left(u_i \mid u_{i-k}, \ldots, u_{i-1} ; \Theta\right) L1(U)=∑ilogP(ui∣ui−k,...,ui−1;Θ)
- Fine-tune: task-specific input transformations + fully-connected layer

Pre-train, Fine-tune: challenges

gap between pre-train and fine-tune

少样本学习能力差、容易过拟合

Pre-train, Fine-tune: challenges

gap between pre-train and fine-tune

少样本学习能力差、容易过拟合

Pre-train, Fine-tune: challenges

cost of fine-tune

现在的预训练模型参数量越来越大，为了一个特定的任务去 finetuning 一个模型，然后部署于线上业务，也会造成部署资源的极大浪费

Pre-train, Prompt, Predict: what is prompting

fine-tuning: 通过改变模型结构，使模型适配下游任务
prompt learning: 模型结构不变，通过重构任务描述，使下游任务适配模型

Pre-train, Prompt, Predict: workflow of prompting

Pre-train, Prompt, Predict: workflow of prompting

Template: 根据任务设计prompt模板，其中包含 input slot[X] 和 answer slot [Z]，后根据模板在 input slot 中填入输入
Mapping (Verbalizer): 将输出的预测结果映射回label

Pre-train, Prompt, Predict: prompt design

Prompting 中最主要的两个部分为 template 与 verbalizer 的设计。

他们可以分别基于任务类型和预训练模型选择(shape)或生成方式(huamn effort)进行分类。

上一篇：未来科技五年人工智能行业产业发展趋势最新竞争力

下一篇：buuctf[极客大挑战 2019]BabySQL--联合注入、双写过滤

热门推荐

01集群聊天服务器---MySQL数据库的建立 02GPU 进阶笔记（二）：华为昇腾 910B GPU 03Coze扣子平台完整体验和实践（附国内和国际版对比）04使用Ruby接入实时行情API教程 05Word粘贴时出现“运行时错误53,文件未找到：MathPage.WLL“的解决方案 06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07Java学习第十五部分——MyBatis 08扣子空间的使用教程与大模型技术思考 09DeepSeek各版本说明与优缺点分析 10基于odoo17的设计模式详解---装饰模式