2022最新版-李宏毅机器学习深度学习课程-P26 Recurrent Neural Network

QwQllly2023-10-20 23:56

RNN

应用场景：填满信息

把每个单词表示成一个向量的方法：独热向量

还有其他方法，比如：Word hashing 单词哈希

输入：单词
输出：该单词属于哪一类的概率分布

由于输入是文字序列，这就产生了一个问题：

是到达还是离开？

隐藏层的输出会被存储在内存中，内存能被视为另一个输入。

改变序列的顺序会改变输出。

RNN的网络结构

目前已提出的两个网络及区别

双向RNN

它与传统的循环神经网络（RNN）相比有一个重要的区别：它在每个时间步上包含两个方向的循环连接，一个从过去到未来（正向），另一个从未来到过去（逆向）。

在双向RNN中，每个时间步的隐藏状态是由两部分组成，一部分来自正向传播，另一部分来自逆向传播。这使得双向RNN能够捕捉到序列中的上下文信息，不仅考虑了过去的信息还考虑了未来的信息。这对于很多自然语言处理任务，如情感分析、命名实体识别、语言建模等非常有用，因为理解一个词语或标记通常需要考虑它周围的上下文。

在训练双向RNN时，通常会使用标准的反向传播算法 ，但是需要在正向和逆向传播中分别计算梯度 ，然后将它们合并以更新网络参数。这使得双向RNN的训练稍微复杂一些，但在实际应用中，往往能够提供更好的性能。

RNN的经典变形：LSTM

四个输入，1个输出，三个门

网络结构

三个门都是1：打开，0：关闭

注意这与遗忘门的名字是反着的，但就是这么奇怪~

操作例子

原本的网络结构

参数是原本的四倍

结构简图

一个单元

多个单元

多层的LSTM

Keras支持三个RNN：LSTM GRU SimpleRNN

上一篇：老师如何发布考试成绩？

下一篇：LuatOS-SOC接口文档(air780E)-- ioqueue - io序列操作

热门推荐

01UV安装并设置国内源 022025最新国内服务器可用docker源仓库地址大全（2025年8月更新）03Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 04全球最强模型Grok4，国内已可免费使用！（附教程）05TRAE Rules 实践：为项目配置 6A 工作流 06KGG转MP3工具|非KGM文件|解密音频 07GPT-5 使用限制与国内升级全攻略（免费 / Plus / Pro）【2025 最新】08Cursor 终端“卡死/无响应”问题的解法 09【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）10Claude Code + claude-code-router白嫖魔搭社区千问模型，开启AI编程之路