GPT的前世今生:从gpt1到chatgpt的能力提升

从2017年google brain提出transformer模型,到2018年基于transformer模型open ai推出了gpt1模型以及google推出了bert模型,到2019-2021年open ai陆续推出gpt2和gpt3,再到2022-2023年推出chat-gpt和gpt4,大语言模型已经发展成了一个具有3个大分支的参天大树[LLM:大语言模型](https://blog.csdn.net/pipisorry/article/details/131079470 "LLM:大语言模型")。在这里主要写写关于gpt的那些事。

GPT-1和GPT-2模型

参考[GPT-1和GPT-2模型详解](https://blog.csdn.net/pipisorry/article/details/108743639 "GPT-1和GPT-2模型详解")

GPT-3

对比

模型 发布时间 参数量 预训练数据量
GPT 2018 年 6 月 1.17 亿 约 5GB
GPT-2 2019 年 2 月 15 亿 40GB
GPT-3 2020 年 5 月 1,750 亿 45TB
相关推荐
SilentSamsara1 小时前
模型可解释性业务化:SHAP/LIME 的业务汇报与合规审查
人工智能·算法·机器学习·自动化
STLearner1 小时前
ICML 2026 | 时间序列(Time Series)论文总结【基础模型,生成,分类,异常检测,插补,表示学习和分析等】
论文阅读·人工智能·python·深度学习·神经网络·机器学习·数据挖掘
qq_408753391 小时前
国内稳定调用 GPT/Claude 的落地实战:从配置到监控
人工智能·aigc·开发工具
ybdesire1 小时前
微调LLM提升工具调用能力的ShareGPT数据格式
运维·服务器·人工智能·大模型·微调
番茄育学园1 小时前
2026 AI图表工具实测:我筛选了5款,帮你绕开做图表的那些坑
人工智能
大模型任我行1 小时前
百度:渐进多令牌预测加速文档解析
人工智能·语言模型·自然语言处理·论文笔记
Chef_Chen1 小时前
论文解读:AgentCoder让编程Agent先过测试再交付
人工智能·agent
2601_954971131 小时前
人工智能与大数据专业填报指南:核心区别、职业路径
大数据·人工智能
Am-Chestnuts1 小时前
AI 公式复制到 Word 乱码怎么办:LaTeX 转 Word 与 DS随心转方案对比
人工智能·word
菜鸟是大神1 小时前
【Hermes入门11讲】第七讲:定时自动化——让Hermes成为你的24小时助手
人工智能·github·hermes