通俗理解词向量模型，预训练模型，Transfomer，Bert和GPT的发展脉络和如何实践

changdejie2023-11-24 11:25

最近研究GPT，深入的从transfomer的原理和代码看来一下，现在把学习的资料和自己的理解整理一下。

这个文章写的很通俗易懂，把transformer的来龙去脉，还举例了很多不错的例子。

Transformer通俗笔记：从Word2Vec、Seq2Seq逐步理解到GPT、BERT_v_JULY_v的博客-CSDN博客

有了原理还需要进行代码实践，这篇文章从0开始讲解了一个简易的Transformer版本和真实版本的代码注释，值得详细读一下。

从零实现Transformer的简易版与强大版：从300多行到3000多行_写transformer-CSDN博客

另外，给大家推荐一下自己动手写代码实践一下，代码模块可以丢给文心一言，GPT4，这些写代码的能力相当的不错，甚至运行出了问题，直接把问题输入给它，还能自己改正。

上一篇：平衡二叉树（简单易懂）

下一篇：走近Webpack

热门推荐

01GitHub 镜像站点 02Codex 接入 DeepSeek API 完整配置文档 03CC-Switch & Claude 基于 Linux 服务器安装使用指南 04【AI】2026 年具身智能模型和世界模型总结 05人工智能最新动态 AI 日报 · 2026年5月10日 06头歌软件工程导论UML画图题(基于starUML)07Gemini大升级、AI眼镜首发、Android XR亮相，13天后见分晓 08Codex 手机端连接教程：三分钟搞定，附完整步骤 09零基础教你claude code 接入 deepseek V4 10AI科技热点日报 | 2026年5月11日