超简单理解LSTM和GRU模型

目录

RNN在反向传播时容易遭受梯度消失的问题,而梯度是用于更新神经网络权重的关键因子,梯度消失描述的是梯度在时间序列反向传播中逐渐减小的情况。

若梯度过小,它对于网络的学习贡献甚微。结果是,在RNN中,梯度更新很小的层级,并不能有效的学习。

RNN 容易遗忘较长序列中的信息,从而只留下短期记忆。

LSTM 和 GRU 正是为了解决短期记忆而设计的。

而LSTM的核心概念是它们的单元状态和各种门。

细胞状态如同一条信息告诉通道,持续传递至整个序列中,它可被视作网络的记忆中心。




参考资料

1\] [超简单理解LSTM和GRU模型,深度学习入门](https://www.bilibili.com/video/BV1EP411Y74W/?spm_id_from=333.337.search-card.all.click&vd_source=b5e395daf1dc59fb72b2633affa96661) 2023.8

相关推荐
KG_LLM图谱增强大模型7 分钟前
悬壶GPT:中医药领域大语言模型的参数高效微调
人工智能·gpt·语言模型·大模型·知识图谱
lifewange9 分钟前
AI 编程的工具有哪些?
人工智能
qq74223498415 分钟前
大模型技术全景与核心概念解析:从基础原理到AI智能体架构
人工智能·python·架构
chasemydreamidea15 分钟前
L2 书生大模型强化学习 RL 实践
人工智能·机器学习
Coder个人博客19 分钟前
Transformers整体架构深度分析
人工智能·自动驾驶·transformer
Rabbit_QL21 分钟前
【深度学习基础】互相关与卷积的本质区别及在深度学习中的应用
人工智能·深度学习
甄心爱学习27 分钟前
数据挖掘-数据仓库与关联规则
人工智能·数据挖掘
郝学胜-神的一滴27 分钟前
机器学习数据工程之基石:论数据集划分之道与sklearn实践
开发语言·人工智能·python·程序人生·机器学习·sklearn
轻竹办公PPT28 分钟前
AI生成PPT好用吗?工作总结场景下的工具排名更新
人工智能·python·powerpoint
SCBAiotAigc29 分钟前
bash前面的(base)实现的原理
人工智能·python·ubuntu