通俗理解词向量模型,预训练模型,Transfomer,Bert和GPT的发展脉络和如何实践

最近研究GPT,深入的从transfomer的原理和代码看来一下,现在把学习的资料和自己的理解整理一下。

  • 这个文章写的很通俗易懂,把transformer的来龙去脉,还举例了很多不错的例子。

Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT_v_JULY_v的博客-CSDN博客

  • 有了原理还需要进行代码实践,这篇文章从0开始讲解了一个简易的Transformer版本和真实版本的代码注释,值得详细读一下。

从零实现Transformer的简易版与强大版:从300多行到3000多行_写transformer-CSDN博客

  • 另外,给大家推荐一下自己动手写代码实践一下,代码模块可以丢给文心一言,GPT4,这些写代码的能力相当的不错,甚至运行出了问题,直接把问题输入给它,还能自己改正。
相关推荐
跨境卫士苏苏10 分钟前
2026 亚马逊生存法则:放弃单点突破,转向多平台全域增长
大数据·人工智能·跨境电商·亚马逊·防关联
工藤学编程19 分钟前
零基础学AI大模型之嵌入模型性能优化
人工智能·性能优化
GIOTTO情35 分钟前
舆情处置的技术实现:Infoseek 如何用 AI 重构 “识别 - 研判 - 处置” 全链路
人工智能·重构
MaisieKim_40 分钟前
如何评估一个新产品机会是否值得投入
大数据·人工智能
一车小面包42 分钟前
空间智能是人工智能的下一个前沿领域
人工智能
deephub1 小时前
AI智能体落地:Agent-Assist vs 全自动化完整决策指南
人工智能·大语言模型·agent
Danceful_YJ2 小时前
36.优化方法
人工智能·pytorch·python·深度学习·优化器算法
C116112 小时前
Jupyter中选择不同的python 虚拟环境
开发语言·人工智能·python
golang学习记2 小时前
TRAE AI 真强,连外国人都在用这些AI技巧
人工智能
化作星辰2 小时前
深度学习_神经网络_损失函数基础
人工智能·深度学习·神经网络