超简单理解LSTM和GRU模型

赵孝正2024-08-19 15:06

目录

参考资料

RNN在反向传播时容易遭受梯度消失的问题，而梯度是用于更新神经网络权重的关键因子，梯度消失描述的是梯度在时间序列反向传播中逐渐减小的情况。

若梯度过小，它对于网络的学习贡献甚微。结果是，在RNN中，梯度更新很小的层级，并不能有效的学习。

RNN 容易遗忘较长序列中的信息，从而只留下短期记忆。

LSTM 和 GRU 正是为了解决短期记忆而设计的。

而LSTM的核心概念是它们的单元状态和各种门。

细胞状态如同一条信息告诉通道，持续传递至整个序列中，它可被视作网络的记忆中心。

参考资料

1\] [超简单理解LSTM和GRU模型，深度学习入门](https://www.bilibili.com/video/BV1EP411Y74W/?spm_id_from=333.337.search-card.all.click&vd_source=b5e395daf1dc59fb72b2633affa96661) 2023.8

上一篇：代码规范 —— Redis 开发规范

下一篇：前端（Vue）全屏 screenfull 通用解决方案及原理分析

热门推荐

01GitHub 镜像站点 02今天 Cloudflare 全球事故，连 GPT 和你的网站都一起“掉线”了 03UV安装并设置国内源 04安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）05BongoCat - 跨平台键盘猫动画工具 06Linux下V2Ray安装配置指南 07Valdi：Snapchat 开源的新一代跨平台 UI 框架 08swagger xss漏洞复现 09全球最强模型Grok4，国内已可免费使用！（附教程）10Labelme从安装到标注：零基础完整指南