RNN、LSTM、Transformer推荐博文

最近在了解RNN、LSTM、transformer的相关原理,看了一些博文,下面做一点记录,以方便自己或者感兴趣的朋友查阅。

如果后续看到别的好的,也可能会更新或者添加在评论里。

RNN:
1.【循环神经网络(RNN)从零开始完整教程】

里面有个小实践,正弦波序列预测。代码格式非常规范,很容易理解。

使用pytorch实现

2.一步一步学RNN:从入门到实践指南

从基础到稍微深一点的应用,都给出了一些小实践。

使用tensorflow实现

3.Pytorch循环神经网络(RNN)快速入门与实战

对语句解释十分详细,文中提到的文章也都很不错,有空可以看看。

使用pytorch实现了对航线的预测。

代码中,有个画3D图的环节,如果不能正常画出3D图,需要把这句话ax = Axes3D(fig) 改成ax = fig.add_subplot(111, projection='3d') ,原语句出问题的原因是,matplotlib新版的用法更加规范

另,plt画图需要用到中文时,记得下中文文字库,不然容易显示错误。要不直接title、label之类全部用英文。

4.循环神经网络(RNN)

这个网站(名叫菜鸟教程)还蛮推荐的,还有很多其他资源。

这篇里面对结构的解释蛮简介的,基本结构形式的代码也有基本展示。要是结构图能有图示就更好了。

LSTM:

LSTM是在RNN基础上,为了解决梯度消失和爆炸的问题,主要引入输入门、遗忘门、输出门。RGU则是对LSTM的简化
1.一个很有名的blog

介绍LSTM基本原理的blog

2.理解Pytorch中LSTM的输入输出参数含义

对参数的维度、语句等有一个较好的解释

Transformer:
1.【超详细】【原理篇&实战篇】一文读懂Transformer

这篇博文的参考文章也非常多,建议可以看看。

2.三万字最全解析!从零实现Transformer(小白必会版😃)

非常详细,有的不懂的,可以边看边搜,代码过一遍,理解会好很多。

这个作者在他别的博文里,还写了一些实践,有时间可以试试。

相关推荐
励志码农43 分钟前
JavaWeb 30 天入门:第二十三天 —— 监听器(Listener)
java·开发语言·spring boot·学习·servlet
DisonTangor1 小时前
字节开源 OneReward: 通过多任务人类偏好学习实现统一掩模引导的图像生成
学习·ai作画·开源·aigc
黎宇幻生2 小时前
Java全栈学习笔记33
java·笔记·学习
2501_926227942 小时前
.Net程序员就业现状以及学习路线图(五)
学习·.net
Elastic 中国社区官方博客2 小时前
Elasticsearch:智能搜索的 MCP
大数据·人工智能·elasticsearch·搜索引擎·全文检索
stbomei2 小时前
从“能说话”到“会做事”:AI Agent如何重构日常工作流?
人工智能
汉克老师3 小时前
第十四届蓝桥杯青少组C++选拔赛[2023.2.12]第二部分编程题(5、机甲战士)
c++·算法·蓝桥杯·01背包·蓝桥杯c++·c++蓝桥杯
朗迹 - 张伟3 小时前
Golang安装笔记
开发语言·笔记·golang
yzx9910133 小时前
生活在数字世界:一份人人都能看懂的网络安全生存指南
运维·开发语言·网络·人工智能·自动化
许泽宇的技术分享4 小时前
LangGraph深度解析:构建下一代智能Agent的架构革命——从Pregel到现代AI工作流的技术飞跃
人工智能·架构