深度之眼(二十九)——神经网络基础知识(四)-循环神经网络

文章目录

一、 学习目标

二、序列数据

序列数据是常见的数据类型,前后数据通常具有关联性

三、语言模型

综合考虑序列数据的关联性

如果句子里面的字数一多,那么计算量就会非常大。

四、循环神经网络

上一个的时间步的隐藏布,会对下一个的时间步的隐藏布产生影响。

多层感知机和循环神经网络

循环神经网络会记录历史信息。W权重矩阵是循环使用的,(Wxh、Whh、Whq)这三个是不会变化的

  1. 循环神经网络的隐藏状态可以捕捉截至当前时间步的序列的历史信息
  2. 循环神经网络模型参数的数量不随时间步的增加而增长

4.1 RNN的反向传播

也称穿越时间的反向传播

五、门控循环单元-GNU

引入门的原因:防止梯度消失

有重置门、更新门。使用激活函数Sigmoid进行判决

5.1 候选隐藏状态

与RNN相比,可以判断是否需要上一个时间布的隐藏状态,从而得出候选隐藏状态。

之后候选隐藏状态与更新门相连接,最后得出下一个隐藏状态

重置门用于候选隐藏状态计算过程当中用来控制上一时间步控制隐藏状态要遗忘哪些信息。

更新门更新当前时间步隐藏状态的时候去组合上一时间步隐藏状态H_t-1以及当前时间步的候选隐藏状态H^~这样进行组合,得到H_t

六、长短期记忆网络-LSTM

个人理解就是长期记忆就是依赖于记忆细胞

主要记住上面这个示意图就能理解LSTM了。

七、回顾

其中BN后面几个都是BN的推广。BN会在baseline里面讲到

相关推荐
谷粒.13 分钟前
测试数据管理难题的7种破解方案
运维·开发语言·网络·人工智能·python
一RTOS一16 分钟前
“智”赋百业 | 东土科技:为工业人工智能铸造“中国根系”
人工智能·科技
周周爱喝粥呀19 分钟前
向量检索:AI 是如何进行语义匹配的?
人工智能
深蓝电商API27 分钟前
爬虫+大模型结合:让AI自动写XPath和清洗规则
人工智能·爬虫
WebGoC开发者38 分钟前
【备赛指导】佛山市青少年科技创新大赛暨佛山市青少年人工智能科创节 智趣AI竞技赛 流程详解
人工智能·经验分享·科技·ai·青少年科技竞赛
大千AI助手1 小时前
模糊集合理论:从Zadeh奠基到现代智能系统融合
人工智能·机器学习·集合·模糊理论·大千ai助手·模糊集合·fuzzysets
数据门徒1 小时前
《人工智能现代方法(第4版)》 第7章 逻辑智能体 学习笔记
人工智能·笔记·学习
生成论实验室1 小时前
周林东的生成论入门十讲 · 第八讲 生成的世界——物理学与生物学新视角
人工智能·科技·神经网络·信息与通信·几何学
东方不败之鸭梨的测试笔记1 小时前
测试工程师如何利用AI大模型?
人工智能
智能化咨询1 小时前
(68页PPT)埃森哲XX集团用户主数据治理项目汇报方案(附下载方式)
大数据·人工智能