长短期记忆网络（LSTM）入门

my烂笔头2025-11-11 20:31

背景

普通 RNN 每次只根据当前输入和前一时刻隐藏状态更新，但这样会导致：

1、信息在时间上被反复乘以梯度矩阵，容易梯度消失/爆炸；

2、记忆"短期"依赖不错，但"长期"记忆难以保留。

LSTM 的核心思想是引入"细胞状态 " ，让网络有一条可以"长期传递信息"的路径，并通过三个门有选择地更新记忆。

LSTM 的核心结构

每个 LSTM 单元有：

一个输入门（input gate）决定写入多少新信息

一个遗忘门（forget gate）决定丢弃多少旧信息

一个输出门（output gate）决定输出多少当前记忆

一个细胞状态（cell state）

上一篇：零基础入门C语言之C语言实现数据结构之顺序表经典算法

下一篇：彻底理解传统卷积，深度可分离卷积

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 04安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）05Linux下V2Ray安装配置指南 06BongoCat - 跨平台键盘猫动画工具 07Labelme从安装到标注：零基础完整指南 08GitLab 零基础入门指南：从安装到项目管理全流程 09看了下昨日泄露的苹果 App Store 源码……10《大数据技术原理与应用》实验报告三熟悉HBase常用操作