nn.RNN解析

以下是RNN的计算公式,t时刻的隐藏状态H(t)等于前一时刻隐藏状态H(t-1)乘以参数矩阵,再加t时刻的输入x(t)乘以参数矩阵,最后再通过激活函数,等到t时刻隐藏状态。

下图是输出input和初始化的隐藏状态,当参数batch_first = True时候,输入是(batch_size,Sequence_length,input_size),参数batch_first = False的时候,输入是
(Sequence_length,batch_size,input_size)

h_0就是初始时刻的隐藏状态hidden state,一般情况下,输入是(D*num_layers,N,H_out)

  • D:如果是双向RNN则为2,如果是单向RNN则为1
  • num_layers: 是RNN的层数
  • N:Batch_size 大小
  • H_in :input size
  • H_out : hidden_size
    写到这里也就把RNN的传入参数给将明白了,主要就是初始隐藏态和input

    输出
  • 输出分别输出最后一个时刻的隐藏态以及所有时刻隐藏态的堆叠,作为输出outputs
  • outputs: 当batch_first = True时,输出为(batch_size,Sequence_length,hidden_size * D);当batch_first = False 的时候,输出为(Sequence_length,Batch_size,hidden_size*D)
  • h_n: 输出为(D*num_layers,Batch_size,hidden_size)
  • 参数 D 同上面一样,这里不在赘述。

    示例:

    RNN 返回值中 outputs 和 hidden_n的关系
    由下图可知,outputs最后一个时间步的输出就是hidden_n
相关推荐
小草cys4 分钟前
AI工作流自动化与智能应用开发平台
运维·人工智能·自动化·dify
小可爱的大笨蛋6 分钟前
Spring AI Alibaba - MCP连接 MySQL
人工智能·mysql·spring·mcp
小流苏生15 分钟前
这只是一罐过期了七年的红牛……
前端·人工智能·程序员
点云SLAM35 分钟前
线性代数的本质大白话理解
人工智能·线性代数·矩阵·向量·矩阵变换·空间变换·线性代数的本质
寻丶幽风36 分钟前
论文阅读笔记——ZeroGrasp: Zero-Shot Shape Reconstruction Enabled Robotic Grasping
论文阅读·笔记·深度学习·机器人·机械臂·具身智能
前进的程序员39 分钟前
AI 能否替代 IT 从业者?
人工智能
赛卡43 分钟前
IPOF(Input-Process-Output-Feedback)方法学简介
人工智能·机器学习·流程图·硬件工程·软件工程·系统工程
whaosoft-1431 小时前
51c大模型~合集122
人工智能
鸿蒙布道师2 小时前
百度Create大会深度解读:AI Agent与多模态模型如何重塑未来?
人工智能·深度学习·神经网络·机器学习·百度·自然语言处理·dubbo
睿途低空新程2 小时前
面向城市治理的AI集群空域融合模型
人工智能·经验分享·其他·无人机