昇思MindSpore第四课---GPT实现情感分类

1. GPT的概念

GPT 系列是 OpenAI 的一系列预训练模型,GPT 的全称是 Generative Pre-Trained Transformer,顾名思义,GPT 的目标是通过Transformer,使用预训练技术得到通用的语言模型。和BERT类似,GPT-1同样采取pre-train +fine-tune的思路:先基于大量未标注语料数据进行预训练,后基于少量标注数据进行微调。

2 实践

2.1 配置环境

安装`mindnlp 套件

2.2 任务训练

OpenAIGPTForSequenceClassification的一些权重没有从openai-gpt的模型检查点初始化,而是重新初始化。

2.3 训练完成

3. 感悟

GPT也是输入句子或者句子对的,并且GPT添加了special tokens。GPT是由Decoder Layer堆叠,Decoder Layer的组成与Transformer Decoder Layer是相似的,不过是没有计算Encode输出与Decoder输入之间的注意力分数multi-head attention的。

相对于BERT,GPT更加注重语句的生成,也就是根据签名的内容预测下一个词是什么。也就是说,GPT更适合生成式的下游任务。

经过这一节课,对于Transformer、BERT以及GPT的理解更加的深刻,对于生成式的大模型有了一个比较直观的认识,对于大模型是如何理解人类语言的方法有了一个初步的认识。而且对模型的微调等概念与方法也有了一个直观地认识。

相关推荐
IT技术猿猴1 小时前
asammdf 库的信号处理和数据分析:深入挖掘测量数据
信息可视化·数据挖掘·数据分析·信号处理·mdf
AI_RSER2 小时前
基于 Google Earth Engine 的南京江宁区土地利用分类(K-Means 聚类)
算法·机器学习·分类·kmeans·聚类·遥感·gee
小小毛桃3 小时前
在分类任务中,显著性分析
人工智能·分类·数据挖掘
lilye663 小时前
精益数据分析(14/126):基于数据洞察优化产品与运营
数据挖掘·数据分析
闲人编程4 小时前
数据分析案例:能源数据分析
python·数据挖掘·数据分析·pandas·能源·数据预处理
云天徽上5 小时前
【数据可视化-33】病毒式社交媒体潮流与用户参与度可视化分析
机器学习·信息可视化·数据挖掘·数据分析·媒体
AI_RSER6 小时前
基于 Google Earth Engine (GEE) 的土地利用变化监测
python·随机森林·分类·土地利用·gee·遥感影像·landsat
蹦蹦跳跳真可爱58911 小时前
Python----深度学习(基于深度学习Pytroch簇分类,圆环分类,月牙分类)
人工智能·pytorch·python·深度学习·分类
搞机小能手18 小时前
六个能够白嫖学习资料的网站
笔记·学习·分类
Olafur_zbj20 小时前
【EDA】EDA中聚类(Clustering)和划分(Partitioning)
机器学习·数据挖掘·聚类