简述循环神经网络RNN

1.why RNN

CNN:处理图像之间没有时间/先后关系

RNN:对于录像,图像之间也许有时间/先后顺序,此时使用CNN效果不会很好,同理和人类的语言相关的方面时间顺序就更为重要了

2.RNN和CNN之间的关联

RNN和CNN本质上其实一致,只是RNN中多了一些权重(W,U)的计算,而且这些线性运算之间都是加法。这些额外的权重虽然使得矩阵的运算变大了,但是并没有使得问题变得特别复杂。也正是由于这些被额外使用的信号,使得我们能够处理序列的问题。

3.RNN由于增加条件产生的问题

  • 梯度爆炸(表现出模型的不稳定、不鲁棒)
  • 梯度消失(出现更多,随着连乘的出现不可避免的出现梯度消失)
    • 有时也许并不是LSTM可以减少梯度消失,使得训练变好,只是提出者的故事讲得好。
    • LSTM(提出类似ResNet的暂存单元形式)
      • 类似电子控制的思想(加门 -- 权重),使得记忆不要一直保存,需要的记忆知识多一些,门就开都大一些(权重值给大一些);需要记忆小一些,门就小一点(权重值小一点);甚至不需要记忆的时候权值为0--关门。
      • 我们也可以在其他领域算法中加一些门来放大哪些内容,阻挡那些内容。
      • 同时我们也要考虑添加了一些内容之后,模型是否还能够计算,能否解释。
    • GRU
      • 对LSTM的一些简化
      • 两个方法的比较研究也许已经被很多博客或者其他人研究过了,所以完成的模型比较研究不是很好做。
相关推荐
xuxianliang4 小时前
第154章 “神谕”的低语(AI)
人工智能·程序员创富
geneculture4 小时前
人机互助新时代超级个体(OPC)的学术述评——基于人文学科与数理学科的双重视域
大数据·人工智能·哲学与科学统一性·信息融智学·融智时代(杂志)
KG_LLM图谱增强大模型4 小时前
给具身智能装上图谱大模型大脑,7B小模型超越72B大模型!层次化知识图谱让复杂机器人规划能力暴增17%,能耗大幅降低
人工智能·机器人·知识图谱
2401_836235864 小时前
名片识别产品:技术要点与应用场景深度解析
人工智能·科技·深度学习·ocr
zchxzl4 小时前
亲测2026京津冀可靠广告展会
大数据·人工智能·python
人工智能AI技术4 小时前
Stable Diffusion 3.0实战:用Colab免费训练你的专属AI绘画模型
人工智能·ai作画
龙山云仓4 小时前
No159:AI中国故事-对话娄敬——戍策长安与AI远见:草根智慧与国都定鼎
人工智能·深度学习·机器学习
qq_390369535 小时前
豆包2.0(Doubao-Seed-2.0)和千问Qwen3.5发布,与Gemini 3 Pro比如何
人工智能
数字芯片实验室5 小时前
AI时代,芯片工程师的入行门槛也被重新定义了
人工智能
Fairy要carry6 小时前
面试-Infra之FFN
人工智能