通俗理解词向量模型,预训练模型,Transfomer,Bert和GPT的发展脉络和如何实践

最近研究GPT,深入的从transfomer的原理和代码看来一下,现在把学习的资料和自己的理解整理一下。

  • 这个文章写的很通俗易懂,把transformer的来龙去脉,还举例了很多不错的例子。

Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT_v_JULY_v的博客-CSDN博客

  • 有了原理还需要进行代码实践,这篇文章从0开始讲解了一个简易的Transformer版本和真实版本的代码注释,值得详细读一下。

从零实现Transformer的简易版与强大版:从300多行到3000多行_写transformer-CSDN博客

  • 另外,给大家推荐一下自己动手写代码实践一下,代码模块可以丢给文心一言,GPT4,这些写代码的能力相当的不错,甚至运行出了问题,直接把问题输入给它,还能自己改正。
相关推荐
落痕的寒假2 小时前
[论文总结] 深度学习在农业领域应用论文笔记14
论文阅读·人工智能·深度学习
神探阿航2 小时前
图像噪声处理技术:让图像更清晰的艺术
图像处理·人工智能·计算机视觉
yuyuyue2493 小时前
lstm预测
人工智能·机器学习
纠结哥_Shrek4 小时前
自然语言处理-词嵌入 (Word Embeddings)
人工智能·自然语言处理
Zfox_4 小时前
DeepSeek R1本地化部署 Ollama + Chatbox 打造最强 AI 工具
人工智能·ai·大模型教程·deepseek
CodeLinghu4 小时前
Agentic Automation:基于Agent的企业认知架构重构与数字化转型跃迁---我的AI经典战例
人工智能·重构·架构
银行数字化转型导师坚鹏4 小时前
数字化转型导师坚鹏:AI大模型DEEPSEEK重构人工智能格局的里程碑
人工智能·ai·重构·deepseek
X.AI6665 小时前
【大模型LLM面试合集】大语言模型架构_MHA_MQA_GQA
人工智能·语言模型·自然语言处理
智识世界Intelligence5 小时前
DeepSeek的崛起与全球科技市场的震荡
人工智能
弥树子5 小时前
使用 PyTorch 实现逻辑回归并评估模型性能
人工智能·pytorch·逻辑回归