深度之眼(二十九)——神经网络基础知识(四)-循环神经网络

文章目录

一、 学习目标

二、序列数据

序列数据是常见的数据类型,前后数据通常具有关联性

三、语言模型

综合考虑序列数据的关联性

如果句子里面的字数一多,那么计算量就会非常大。

四、循环神经网络

上一个的时间步的隐藏布,会对下一个的时间步的隐藏布产生影响。

多层感知机和循环神经网络

循环神经网络会记录历史信息。W权重矩阵是循环使用的,(Wxh、Whh、Whq)这三个是不会变化的

  1. 循环神经网络的隐藏状态可以捕捉截至当前时间步的序列的历史信息
  2. 循环神经网络模型参数的数量不随时间步的增加而增长

4.1 RNN的反向传播

也称穿越时间的反向传播

五、门控循环单元-GNU

引入门的原因:防止梯度消失

有重置门、更新门。使用激活函数Sigmoid进行判决

5.1 候选隐藏状态

与RNN相比,可以判断是否需要上一个时间布的隐藏状态,从而得出候选隐藏状态。

之后候选隐藏状态与更新门相连接,最后得出下一个隐藏状态

重置门用于候选隐藏状态计算过程当中用来控制上一时间步控制隐藏状态要遗忘哪些信息。

更新门更新当前时间步隐藏状态的时候去组合上一时间步隐藏状态H_t-1以及当前时间步的候选隐藏状态H^~这样进行组合,得到H_t

六、长短期记忆网络-LSTM

个人理解就是长期记忆就是依赖于记忆细胞

主要记住上面这个示意图就能理解LSTM了。

七、回顾

其中BN后面几个都是BN的推广。BN会在baseline里面讲到

相关推荐
Tezign_space几秒前
企业级AI发展新趋势:Copilot、流程自动化与智能体系统
人工智能·自动化·copilot·dam·上下文工程·gea·智能体系统
木斯佳2 分钟前
HarmonyOS 6实战(源码教学篇)— Speech Kit 新特性【仿某云音乐实现并集成AI字幕】
人工智能·华为·harmonyos
愚公搬代码2 分钟前
【愚公系列】《AI+直播营销》050-销讲型直播内容策划(销讲型直播的社群4步销售法)
人工智能
袋鼠云数栈3 分钟前
袋鼠云产品功能更新报告(第16期)|离线开发新进化:AI辅助与架构升级
大数据·人工智能·架构
Joker可视化开发平台3 分钟前
Joker重磅发布AIx智绘工坊!无限画布重构AI创意生产新范式
人工智能·ai
贵州晓智信息科技4 分钟前
一组高质量 .AI 域名资产整理与出售说明
人工智能
陈天伟教授4 分钟前
人工智能应用-机器听觉: 06.基于统计的语音识别
人工智能·语音识别
Sinokap4 分钟前
微软自研 AI 芯片 Maia 200 正式亮相:算力竞争进入“基础设施内卷”阶段
人工智能·microsoft
赋创小助手5 分钟前
Maia 200 技术拆解:微软云端 AI 推理加速器的设计取舍
服务器·人工智能·科技·深度学习·神经网络·microsoft·自然语言处理