GPT的前世今生:从gpt1到chatgpt的能力提升

从2017年google brain提出transformer模型,到2018年基于transformer模型open ai推出了gpt1模型以及google推出了bert模型,到2019-2021年open ai陆续推出gpt2和gpt3,再到2022-2023年推出chat-gpt和gpt4,大语言模型已经发展成了一个具有3个大分支的参天大树[LLM:大语言模型](https://blog.csdn.net/pipisorry/article/details/131079470 "LLM:大语言模型")。在这里主要写写关于gpt的那些事。

GPT-1和GPT-2模型

参考[GPT-1和GPT-2模型详解](https://blog.csdn.net/pipisorry/article/details/108743639 "GPT-1和GPT-2模型详解")

GPT-3

对比

模型 发布时间 参数量 预训练数据量
GPT 2018 年 6 月 1.17 亿 约 5GB
GPT-2 2019 年 2 月 15 亿 40GB
GPT-3 2020 年 5 月 1,750 亿 45TB
相关推荐
秋94 小时前
Python工程师面试常问提问和回答(AI工程化方向 · 2026版)
人工智能·python·面试
炎武丶航4 小时前
LeNet-5深度学习详解:从手写数字识别到代码实战
人工智能·python·深度学习·机器学习·ai·cnn·lenet
CIO_Alliance4 小时前
2026年度iPaaS集成平台及服务商综合能力评估与行业趋势分析(企业级AI化转型)
人工智能·ipaas·制造业·企业数智化转型·零售电商·ai+ipaas
星辰徐哥4 小时前
Python AI基础:Matplotlib与Seaborn数据可视化
人工智能·python·matplotlib
terry6004 小时前
2026滑动拼图验证码选型指南:AI对抗下的厂商对比与落地实测
大数据·人工智能·web安全·信息与通信·数据库架构
星辰徐哥4 小时前
Python AI基础:Python面向对象编程
开发语言·人工智能·python
可涵不会debug5 小时前
当AI学会了“讲故事“:我用魔珐星云做了一个沉浸式互动叙事Agent
人工智能
沐自礼5 小时前
图像伪造识别和定位
人工智能·llm
AI 小老六5 小时前
Google AX 控制面拆解:分布式 Agent 如何把断点恢复、审计策略和执行调度收进同一条链路
人工智能·分布式·后端·ai·架构·ai编程
阿部多瑞 ABU5 小时前
数据循环悖论:AI检测模型的技术局限与生态灾难
大数据·人工智能·安全·机器学习·ai·自然语言处理