超简单理解LSTM和GRU模型

目录

RNN在反向传播时容易遭受梯度消失的问题,而梯度是用于更新神经网络权重的关键因子,梯度消失描述的是梯度在时间序列反向传播中逐渐减小的情况。

若梯度过小,它对于网络的学习贡献甚微。结果是,在RNN中,梯度更新很小的层级,并不能有效的学习。

RNN 容易遗忘较长序列中的信息,从而只留下短期记忆。

LSTM 和 GRU 正是为了解决短期记忆而设计的。

而LSTM的核心概念是它们的单元状态和各种门。

细胞状态如同一条信息告诉通道,持续传递至整个序列中,它可被视作网络的记忆中心。




参考资料

1\] [超简单理解LSTM和GRU模型,深度学习入门](https://www.bilibili.com/video/BV1EP411Y74W/?spm_id_from=333.337.search-card.all.click&vd_source=b5e395daf1dc59fb72b2633affa96661) 2023.8

相关推荐
多则惑少则明3 分钟前
AI测试、大模型测试(五)AI测试工具有哪些
人工智能·测试工具·ai测试·大模型测试
沃丰科技4 分钟前
以全栈AI能力重塑智能客服服务效能
人工智能·机器学习·自然语言处理
O561 6O623O7 安徽正华露4 分钟前
(露)冷光源 大鼠洞板 新生鼠适配器
人工智能
musk12125 分钟前
深度学习中 z-score 标准化理解
人工智能·深度学习·z-socre
小脉传媒GEO优化7 分钟前
掌控数据燃料:面向ChatGPT的数据策略优化指南
人工智能·chatgpt
多则惑少则明7 分钟前
AI测试、大模型测试(四)AI测试分类&AI测试岗位分工
人工智能·ai测试·大模型测试·算法测试
Mxsoft61910 分钟前
我发现边缘节点资源不足致处理延迟,动态资源调度算法救场!
人工智能
shayudiandian12 分钟前
MobaXterm高效运维实战技术文章大纲
人工智能
小白狮ww14 分钟前
挥手点亮圣诞:AI 3D 魔法树教程
人工智能·深度学习·机器学习·3d·音视频·图片处理·动作识别
码界奇点17 分钟前
基于深度学习的人脸识别考勤系统设计与实现
人工智能·深度学习·车载系统·毕业设计·源代码管理