nn.RNN解析

以下是RNN的计算公式,t时刻的隐藏状态H(t)等于前一时刻隐藏状态H(t-1)乘以参数矩阵,再加t时刻的输入x(t)乘以参数矩阵,最后再通过激活函数,等到t时刻隐藏状态。

下图是输出input和初始化的隐藏状态,当参数batch_first = True时候,输入是(batch_size,Sequence_length,input_size),参数batch_first = False的时候,输入是
(Sequence_length,batch_size,input_size)

h_0就是初始时刻的隐藏状态hidden state,一般情况下,输入是(D*num_layers,N,H_out)

  • D:如果是双向RNN则为2,如果是单向RNN则为1
  • num_layers: 是RNN的层数
  • N:Batch_size 大小
  • H_in :input size
  • H_out : hidden_size
    写到这里也就把RNN的传入参数给将明白了,主要就是初始隐藏态和input

    输出
  • 输出分别输出最后一个时刻的隐藏态以及所有时刻隐藏态的堆叠,作为输出outputs
  • outputs: 当batch_first = True时,输出为(batch_size,Sequence_length,hidden_size * D);当batch_first = False 的时候,输出为(Sequence_length,Batch_size,hidden_size*D)
  • h_n: 输出为(D*num_layers,Batch_size,hidden_size)
  • 参数 D 同上面一样,这里不在赘述。

    示例:

    RNN 返回值中 outputs 和 hidden_n的关系
    由下图可知,outputs最后一个时间步的输出就是hidden_n
相关推荐
踏着七彩祥云的小丑几秒前
AI——Dify上传 PDF/Word 打造私有文档问答机器人
人工智能·ai
sinat_286945191 分钟前
llm wiki
人工智能·算法·chatgpt
a8057626872 分钟前
Luston.ai深度评测:沉浸式AI虚拟陪伴,普通与18+双模式全体验
人工智能
Kiyra3 分钟前
Agent 的记忆不是存数据库就行:上下文预算与轻量记忆的设计实战
数据库·人工智能·后端·面试·职场和发展·哈希算法
agicall.com3 分钟前
信电助 - 信创无线盒 UB-W-XC 型号功能列表
人工智能·语音识别·信创电话助手·座机语音转文字·固话座机录音转文字
昨夜见军贴06165 分钟前
爆破冲击试验越来越严格,AI报告审核如何借助IACheck守住安全底线
人工智能·安全
TEC_INO5 分钟前
Linux_54:RV1126的VI模块讲解
linux·运维·人工智能
mit6.82413 分钟前
20种Agent 设计模式
人工智能·设计模式
张二娃同学14 分钟前
专栏第01篇_深度学习导论
人工智能·python·深度学习·cnn
DragonnAi17 分钟前
论文解读:SFINet 空间-频率统一学习框架用于多模态图像融合
深度学习·学习·计算机视觉