nn.RNN解析

以下是RNN的计算公式,t时刻的隐藏状态H(t)等于前一时刻隐藏状态H(t-1)乘以参数矩阵,再加t时刻的输入x(t)乘以参数矩阵,最后再通过激活函数,等到t时刻隐藏状态。

下图是输出input和初始化的隐藏状态,当参数batch_first = True时候,输入是(batch_size,Sequence_length,input_size),参数batch_first = False的时候,输入是
(Sequence_length,batch_size,input_size)

h_0就是初始时刻的隐藏状态hidden state,一般情况下,输入是(D*num_layers,N,H_out)

  • D:如果是双向RNN则为2,如果是单向RNN则为1
  • num_layers: 是RNN的层数
  • N:Batch_size 大小
  • H_in :input size
  • H_out : hidden_size
    写到这里也就把RNN的传入参数给将明白了,主要就是初始隐藏态和input

    输出
  • 输出分别输出最后一个时刻的隐藏态以及所有时刻隐藏态的堆叠,作为输出outputs
  • outputs: 当batch_first = True时,输出为(batch_size,Sequence_length,hidden_size * D);当batch_first = False 的时候,输出为(Sequence_length,Batch_size,hidden_size*D)
  • h_n: 输出为(D*num_layers,Batch_size,hidden_size)
  • 参数 D 同上面一样,这里不在赘述。

    示例:

    RNN 返回值中 outputs 和 hidden_n的关系
    由下图可知,outputs最后一个时间步的输出就是hidden_n
相关推荐
小和尚同志5 分钟前
国产终端编码神器,编程 CLI 大善人——IFlow CLI
人工智能·aigc
爱跑步的george1 小时前
时间序列预测的“诸神之战”:树模型 (XGB/LGBM) vs 深度学习(Transformer/RNN) 的工业界大对决
深度学习
PNP Robotics1 小时前
PNP机器人上海宝山智能机器人年会发表机器人10年主题演讲演讲
人工智能·python·机器人
沫儿笙1 小时前
abb焊接机器人保护气体省气设备
人工智能·机器人
机器人行业研究员1 小时前
轮足之争外,六维力传感器才是机器人的隐形核心
人工智能·机器人·人机交互·六维力传感器·关节力传感器
+wacyltd大模型备案算法备案1 小时前
模型备案服务从业者,专业讲解:大模型备案(生成式人工智能)
人工智能
PyAIGCMaster1 小时前
如何编译一个apk,我是新手
深度学习·学习
搬砖者(视觉算法工程师)2 小时前
人工智能(AI)的工程原理与应用
人工智能
da_vinci_x2 小时前
PS 3D Viewer (Beta):概念美术的降维打击,白模直接在PS里转光打影出5张大片
人工智能·游戏·3d·prompt·aigc·材质·游戏美术
飞哥数智坊2 小时前
提示词工程没死,只是藏得更深了
人工智能