【论文笔记】GPT，GPT-2，GPT-3

爱学习的卡比兽2024-01-28 23:47

参考：GPT，GPT-2，GPT-3【论文精读】

GPT

Transformer的解码器，仅已知"过去"，推导"未来"

论文地址：Improving Language Understanding by Generative Pre-Training

半监督学习：无标签数据集预训练模型，有标签数据集微调

BERT

Transformer的编码器，完形填空，已知 "过去" 和 "未来"，推导中间值

论文地址：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

GPT-2

zero-ont - 探索模型泛化能力；兼容 下游任务 的无障碍使用；

论文地址：Language Models are Unsupervised Multitask Learners

GPT-3

引入 prompt，提升 GPT-2 的有效性；

论文地址：language models are few-shot learners

写在最后：若本文章对您有帮助，请点个赞啦 ٩(๑•̀ω•́๑)۶

上一篇：R语言【taxlist】——indended_list()：将层级结构输出为缩进列表

下一篇：『Echarts』简介

热门推荐

01GitHub 镜像站点 02【保姆级教程】免费使用Gemini3的5种方法！免翻墙/国内直连 03BongoCat - 跨平台键盘猫动画工具 04UV安装并设置国内源 05Google Antigravity：无法登录？早期错误、登录修复和用户反馈指南 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07Linux下V2Ray安装配置指南 08Spring Boot 4.0 发布总结：新特性、依赖变更与升级指南 09全球最强模型Grok4，国内已可免费使用！（附教程）10Labelme从安装到标注：零基础完整指南