GPT的前世今生:从gpt1到chatgpt的能力提升

从2017年google brain提出transformer模型,到2018年基于transformer模型open ai推出了gpt1模型以及google推出了bert模型,到2019-2021年open ai陆续推出gpt2和gpt3,再到2022-2023年推出chat-gpt和gpt4,大语言模型已经发展成了一个具有3个大分支的参天大树[LLM:大语言模型]。在这里主要写写关于gpt的那些事。

GPT-1和GPT-2模型

参考[GPT-1和GPT-2模型详解]

GPT-3

对比

模型 发布时间 参数量 预训练数据量
GPT 2018 年 6 月 1.17 亿 约 5GB
GPT-2 2019 年 2 月 15 亿 40GB
GPT-3 2020 年 5 月 1,750 亿 45TB
相关推荐
youcans_2 分钟前
【AGI使用教程】GPT-OSS 本地部署(2)
人工智能·gpt·大语言模型·模型部署·webui
鲸鱼240114 分钟前
支持向量机
人工智能·机器学习·支持向量机
AImatters1 小时前
透视光合组织大会:算力生态重构金融AI落地新实践
人工智能·合合信息·国产算力·海光dcu·光合组织·光合大会·青云
DDC楼宇自控与IBMS集成系统解读1 小时前
BA 楼宇自控系统 + AI:重构楼宇设备管理的 “智能决策” 体系
大数据·网络·数据库·人工智能·3d·重构
躺不平的小刘1 小时前
通义灵码插件——AI 重构表单开发!半小时搭建可视化拖拽系统,效率碾压传统模式
人工智能·重构
爱喝奶茶的企鹅1 小时前
Ethan独立开发新品速递 | 2025-08-25
人工智能
江瀚视野1 小时前
多地闭店上热搜,中产的白月光无印良品怎么了?
大数据·人工智能
yuanpan1 小时前
OpenCV打开视频函数VideoCapture使用详解
人工智能·opencv·音视频
朱程2 小时前
写给自己的 LangChain 开发教程(三):Agent & Tools
前端·人工智能
AI前沿简报-ALLMHUB2 小时前
AI前沿简报20250825——腾讯、阿里IDE迎重大更新,字节跳动首次开源36B大语言模型,快手8B模型刷新记录,马斯克称xAI最大竞争对手是中国公司
人工智能·语言模型·自然语言处理