通俗理解词向量模型,预训练模型,Transfomer,Bert和GPT的发展脉络和如何实践

最近研究GPT,深入的从transfomer的原理和代码看来一下,现在把学习的资料和自己的理解整理一下。

  • 这个文章写的很通俗易懂,把transformer的来龙去脉,还举例了很多不错的例子。

Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT_v_JULY_v的博客-CSDN博客

  • 有了原理还需要进行代码实践,这篇文章从0开始讲解了一个简易的Transformer版本和真实版本的代码注释,值得详细读一下。

从零实现Transformer的简易版与强大版:从300多行到3000多行_写transformer-CSDN博客

  • 另外,给大家推荐一下自己动手写代码实践一下,代码模块可以丢给文心一言,GPT4,这些写代码的能力相当的不错,甚至运行出了问题,直接把问题输入给它,还能自己改正。
相关推荐
我叫侯小科16 小时前
YOLOv4:目标检测界的 “集大成者”
人工智能·yolo·目标检测
小姐姐味道16 小时前
AI应用时代:多读论文勤尝试,少做讨论少分享,是活下去的关键
人工智能·程序员·开源
星期天要睡觉16 小时前
大模型(Large Language Model, LLM)——什么是大模型,大模型的基本原理、架构、流程
人工智能·python·ai·语言模型
墨利昂16 小时前
机器学习和深度学习模型训练流程
人工智能·深度学习·机器学习
wktomo16 小时前
数据挖掘比赛baseline参考
人工智能·数据挖掘
言之。16 小时前
大语言模型科普报告
人工智能·语言模型·自然语言处理
文火冰糖的硅基工坊16 小时前
[人工智能-大模型-27]:大模型应用层技术栈 - 大语言模型中的token是什么?
人工智能·语言模型·自然语言处理
Test-Sunny17 小时前
【AI增强质量管理体系结构】AI+自动化测试引擎 与Coze
人工智能
gaosushexiangji17 小时前
庆祝第33届国际高速成像与光子学会议盛大召开(I)—sCMOS相机在物理与光电成像领域应用
人工智能·制造
gaosushexiangji17 小时前
恭贺第33届国际高速成像与光子学会议盛大召开(II)—sCMOS相机在细胞与生物成像领域应用
人工智能