目录
[第一章 神经网络基础](#第一章 神经网络基础)
[3 循环神经网络](#3 循环神经网络)
[▲ 循环神经网络简介](#▲ 循环神经网络简介)
[▲ 循环神经网络应用](#▲ 循环神经网络应用)
[▲ 循环神经网络变种](#▲ 循环神经网络变种)
第一章 神经网络基础
3 循环神经网络
▲ 循环神经网络简介
循环神经网络( Recurrent Neural Network ,简称 RNN )是一种通过隐藏层节点周期性 的连接,来捕捉++++序列化++++数据中动态信息的神经网络,可以对序列化的数据进行分类。
![](https://i-blog.csdnimg.cn/direct/a46f14d485b9438180315341ab43e31b.png)
标准RNN结构
![](https://i-blog.csdnimg.cn/direct/5d6fbd1658a14610ae7dc6865efd670d.png)
多层双向循环神经网络
![](https://i-blog.csdnimg.cn/direct/f200a12542664302b8cb2f00e8fbc434.png)
BPTT反向传播求导
![](https://i-blog.csdnimg.cn/direct/bb63854eb20b451498e17b296ebeb1b4.png)
标准RNN结构的问题
解决了信息记忆的问题,但是对长时间记忆的信息会衰减。很多任务需要保存长时间的记忆信息。
基本的循环神经网络存在梯度爆炸和梯度消失问题,并不能真正的处理好长距离的依赖。如下:
![](https://i-blog.csdnimg.cn/direct/05b22e8f317f4f9eacbf56657315ccdc.png)
▲ 循环神经网络应用
循环神经网络的应用
![](https://i-blog.csdnimg.cn/direct/7fafab6566dc4f37b22c7a3759bab94d.png)
▲ 循环神经网络变种
长短期记忆网络
长短期记忆网络( Long Short Term Memory , LSTM ):一种特殊的 RNN 类型,可以学习长期依赖信息。
![](https://i-blog.csdnimg.cn/direct/f020549c4c594024a7bdc48ca89fb8e9.png)
LSTM 的记忆单元和标准 RNN 一样,负责记录之前的信息 。
![](https://i-blog.csdnimg.cn/direct/69cf37954dd84192af8463b4de0d6403.png)
遗忘门结构通过分析上一时刻的输出,和当前时刻的输入,计算出遗忘系数 。
![](https://i-blog.csdnimg.cn/direct/2385c97989dc49ebbdefd5abef068792.png)
输入门结构通过分析上一时刻的输出,和当前时刻的输入,计算出输入系数和需要新记忆的内容。
![](https://i-blog.csdnimg.cn/direct/a6ddf2e0d3e74b9e8395d270c5f02a71.png)
信息更新
![](https://i-blog.csdnimg.cn/direct/6c66c715fb474c9c8af87740922c1fbd.png)
输出门
![](https://i-blog.csdnimg.cn/direct/81bc441229694802ae69b887c66afd04.png)
GRU
****门控循环单元( Gated Recurrent Unit , GRU )****是简化版的 LSTM 。因为 LSTM 中,遗忘门和输入门的关系互补,所以 GRU 用一个门代替。
在 LSTM 中引入了三个门函数: ++++输入门++++ 、 ++++遗忘门++++ 和 ++++输出门++++ 来控制输入值、记忆值和输出值。
在 GRU 模型中只有两个门:分别是 ++++更新门++++ 和 ++++重置门++++。
![](https://i-blog.csdnimg.cn/direct/4bfc79be80074173a751cc82b77fdd13.png)
说明:本文内容来源于网络,仅作为学习用途,如有侵权,请联系作者删除。