2022最新版-李宏毅机器学习深度学习课程-P26 Recurrent Neural Network

RNN

应用场景:填满信息

把每个单词表示成一个向量的方法:独热向量

还有其他方法,比如:Word hashing 单词哈希

  • 输入:单词
  • 输出:该单词属于哪一类的概率分布

由于输入是文字序列,这就产生了一个问题:

是到达还是离开?

隐藏层的输出会被存储在内存中,内存能被视为另一个输入。

改变序列的顺序会改变输出。

RNN的网络结构

目前已提出的两个网络及区别

双向RNN

它与传统的循环神经网络(RNN)相比有一个重要的区别:它在每个时间步上包含两个方向的循环连接,一个从过去到未来(正向),另一个从未来到过去(逆向)。

在双向RNN中,每个时间步的隐藏状态是由两部分组成,一部分来自正向传播,另一部分来自逆向传播。这使得双向RNN能够捕捉到序列中的上下文信息,不仅考虑了过去的信息还考虑了未来的信息。这对于很多自然语言处理任务,如情感分析、命名实体识别、语言建模等非常有用,因为理解一个词语或标记通常需要考虑它周围的上下文。

在训练双向RNN时,通常会使用标准的反向传播算法 ,但是需要在正向和逆向传播中分别计算梯度 ,然后将它们合并以更新网络参数。这使得双向RNN的训练稍微复杂一些,但在实际应用中,往往能够提供更好的性能。

RNN的经典变形:LSTM

四个输入,1个输出,三个门

网络结构

三个门都是1:打开,0:关闭

注意这与遗忘门的名字是反着的,但就是这么奇怪~

操作例子

原本的网络结构

参数是原本的四倍

结构简图

一个单元

多个单元

多层的LSTM

Keras支持三个RNN:LSTM GRU SimpleRNN

相关推荐
Mr数据杨2 小时前
加州房价中位数预测在房地产估值中的应用
机器学习·数据分析·kaggle
xiaotao1312 小时前
02-机器学习基础: 监督学习——线性回归
学习·机器学习·线性回归
曦樂~2 小时前
【机器学习】概述
人工智能·机器学习
DeniuHe2 小时前
机器学习模型中的偏置项(bias / 截距项)到底有什么用?
人工智能·机器学习
小江的记录本2 小时前
【网络安全】《网络安全常见攻击与防御》(附:《六大攻击核心特性横向对比表》)
java·网络·人工智能·后端·python·安全·web安全
思绪无限2 小时前
YOLOv5至YOLOv12升级:植物叶片病害识别系统的设计与实现(完整代码+界面+数据集项目)
深度学习·yolo·目标检测·yolov12·yolo全家桶·植物叶片病害检测
白羊by3 小时前
YOLOv1~v11 全版本核心演进总览
深度学习·算法·yolo
深小乐3 小时前
AI 周刊【2026.04.13-04.19】:中美差距减小、Claude Opus 4.7发布、国产算力突围
人工智能
深小乐3 小时前
从 AI Skills 学实战技能(七):让 AI 自动操作浏览器
人工智能
workflower3 小时前
人机交互部分OOD
运维·人工智能·自动化·集成测试·人机交互·软件需求