昇思MindSpore第六课---Roberta Prompt Turning

1. Roberta Prompt Turning的概念

在了解预训练语言模型的基础,以及预训练语言模型在Pre-training和Fine-tuning之后,我们已经可以预想到 Prompt的目的是将Fine-tuning的下游任务目标转换为Pre-training的任务 。

Prompt-Tuning起源于GPT-3的提出《Language Models are Few-Shot Learners》(NIPS2020),其认为超大规模的模型只要配合好合适的模板就可以极大化地发挥其推理和理解能力。

2 实践

2.1 配置环境

安装mindnlp 套件

2.2 模型与数据集加载

本案例对roberta-large模型基于GLUE基准数据集进行prompt tuning。

2.3 模型微调(prompt tuning)

按照如下步骤定义训练逻辑:

  1. 构建正向计算函数
  2. 函数变换,获取微分函数
  3. 定义训练一个step的逻辑
  4. 遍历训练数据集进行模型训练,同时每一个epoch后,遍历验证数据集获取当前的评价指标(accuracy、f1 score)

3. 感悟

每节课的深度在不断增加,对于初学者确实有些难度,很多概念也是云里雾里,但是对于模型的架构还是有一个比较清晰的概念。对于模型与数据的加载以及模型的训练也更加熟悉。对于模型的微调也有了一个更清楚的认识。也了解了大模型通过提供"提示"来鼓励预先训练的模型做出特定的预测,指定要完成的任务。这对于大模型是一个非常重要的概念,也让我们更理解大模型运行的原理。

相关推荐
sinat_286945197 小时前
AI应用安全 - Prompt注入攻击
人工智能·安全·prompt
居7然2 天前
解锁AI大模型:Prompt工程全面解析
人工智能·prompt·提示词
Jinkxs3 天前
Prompt Engineering+AI工具链:打造个人专属的智能开发助手
人工智能·prompt
爱分享的飘哥3 天前
第六十六篇:AI模型的“口才”教练:Prompt构造策略与自动化实践
人工智能·自动化·prompt·aigc·数据集·llm训练·数据工程
编码小袁3 天前
Prompt工程师基础技术学习指南:从入门到实战
prompt
zhurui_xiaozhuzaizai4 天前
OpenAI官方写的GPT-5 prompt指南
gpt·prompt
sssammmm4 天前
AI入门学习--如何写好prompt?
人工智能·学习·prompt
zzywxc7876 天前
深入解析大模型落地的四大核心技术:微调、提示词工程、多模态应用 及 企业级解决方案,结合代码示例、流程图、Prompt案例及技术图表,提供可落地的实践指南。
人工智能·深度学习·机器学习·数据挖掘·prompt·流程图·editplus
科大饭桶8 天前
AI大模型专题:LLM大模型(Prompt提示词工程)
人工智能·语言模型·llm·prompt·deepseek
六毛的毛8 天前
LangChain入门:内存、记录聊天历史 ChatMessageHistory、模型、提示 ( Prompt )、模式 ( Schema )
人工智能·langchain·prompt