生成式大语言模型论文导读

当下,最火的人工智能无疑就是生成式大模型,包括纯大语言模型和多模态模型,所以本次也抱着学习的态度,以大模型发展的时间线来对主要节点的一些生成式语言模型的论文进行分享(论文和分享内容会动态更新)。

分享目录

transformer原理-Attention Is All You Need -2017(待补充)
GPT-1原理-Improving Language Understanding by Generative Pre-Training -2018
BERT原理-Pre-training of Deep Bidirectional Transformers for Language Understanding -2018
GPT-2原理-Language Models are Unsupervised Multitask Learners -2019

T5原理-Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer -2019(待补充)

GPT-3原理-Language Models are Few-Shot Learners -2019(待补充)

【动态更新中】

相关推荐
阿聪谈架构11 分钟前
第13章:AI异步与生产部署 —— 让 AI 服务稳定高效地面向用户
人工智能·后端
黑暗森林观察者22 分钟前
AI Agent 的"记忆进化":Skills 自进化框架如何让 Agent 越用越聪明?
人工智能
兆。28 分钟前
LangChain大模型服务集成指南:面向AI应用开发者
人工智能·langchain
刘一说38 分钟前
AI科技热点日报 | 2026年5月29日
人工智能·科技
jkyy20141 小时前
AI健康管家:大模型赋能私域健康服务,重塑新零售智慧运营体系
人工智能·零售
薛定猫AI1 小时前
Codex 与 Claude Code 安装配置完全指南
大数据·人工智能·架构
前沿AI1 小时前
AI营销服一体化方案亮相2026中国汽车经销商大会,助力汽车销售全链路提效
大数据·人工智能·汽车
头盔小妹1 小时前
在本地调用大语言模型
人工智能·语言模型·自然语言处理
圣殿骑士-Khtangc1 小时前
智谱AI完成5亿美元融资 + AutoGLM 2.0发布:对标GPT-5 Agent Mode
人工智能
LLM落地研习社1 小时前
一行命令部署 NIM:Docker 容器化生产级最佳实践
人工智能