GPT的前世今生:从gpt1到chatgpt的能力提升

从2017年google brain提出transformer模型,到2018年基于transformer模型open ai推出了gpt1模型以及google推出了bert模型,到2019-2021年open ai陆续推出gpt2和gpt3,再到2022-2023年推出chat-gpt和gpt4,大语言模型已经发展成了一个具有3个大分支的参天大树[LLM:大语言模型]。在这里主要写写关于gpt的那些事。

GPT-1和GPT-2模型

参考[GPT-1和GPT-2模型详解]

GPT-3

对比

模型 发布时间 参数量 预训练数据量
GPT 2018 年 6 月 1.17 亿 约 5GB
GPT-2 2019 年 2 月 15 亿 40GB
GPT-3 2020 年 5 月 1,750 亿 45TB
相关推荐
全域观察4 分钟前
出海攻略,如何一键保存Facebook视频素材
人工智能·新媒体运营·aigc·内容运营·程序员创富
AI完全体6 分钟前
【AI日记】24.11.08 Knowledge Graphs for RAG (知识图谱,Neo4j,Cypher)
人工智能·自然语言处理·知识图谱·neo4j·rag·日记·cypher
OBOO鸥柏16 分钟前
OBOO鸥柏:旗下户外景区自助触摸查询一体机已布局智慧城市便民
大数据·人工智能·科技·系统架构·智慧城市·大屏端
树莓集团20 分钟前
以数字产业园区规划为笔,绘智慧城市新篇章
大数据·人工智能·科技·物联网·智慧城市·媒体
神奇的布欧24 分钟前
TransFormer--注意力机制:位置编码
人工智能·python·深度学习·学习·transformer
神秘的土鸡28 分钟前
机器情绪及抑郁症算法
人工智能·算法
Crazy Struggle29 分钟前
.NET 9 发布 性能提升、AI 支持与全方位改进
人工智能·ai·.net aspire·.net 9.0
亿佛1 小时前
自动驾驶仿真 软件在环测试
人工智能·机器学习·自动驾驶·测试用例
数据猿1 小时前
【金猿案例展】上海汽检——智能网联自动驾驶交通事故原因分析服务平台
人工智能·机器学习·自动驾驶
Deepcong1 小时前
多个摄像机画面融合:找到同一个目标在多个画面中的伪三维坐标,找出这几个摄像头间的转换矩阵
人工智能·线性代数·矩阵