pytorch-pytorch之LSTM

目录

  • [1. nn.LSTM](#1. nn.LSTM)
  • [2. nn.LSTMCell](#2. nn.LSTMCell)

1. nn.LSTM

初始化函数输入参数与RNN相同,分别是input_size,hidden_size和num_layer

foward函数也与RNN类似,只不过返回值除了out外,ht变为(ht,ct)

代码见下图:

2. nn.LSTMCell

初始化函数输入参数与nn.LSTM类似

forward函数与nn.LSTM的区别是没有out

单层代码如下图:

和RNN的Cell类似,Cell单元循环更新h,c

2层无非就是多创建了一个cell2、h2、c2,并同时循环更新h1,c1,h2,c2,多层以此类推。

相关推荐
大模型任我行3 小时前
阿里:揭示RLVR训练不稳定性根源
人工智能·语言模型·自然语言处理·论文笔记
沃达德软件7 小时前
视频增强技术解析
人工智能·目标检测·机器学习·计算机视觉·超分辨率重建
魔乐社区7 小时前
GLM-5上线魔乐社区,基于昇腾的模型推理+训练部署教程请查收!
人工智能·开源·大模型
geneculture8 小时前
化繁为简且以简驭繁:唯文论英汉对照哲学术语49个主义/论
人工智能·融智学的重要应用·哲学与科学统一性·信息融智学·融智时代(杂志)
睡醒了叭8 小时前
coze-工作流-http请求
人工智能·aigc
twilight_4699 小时前
机器学习与模式识别——机器学习中的搜索算法
人工智能·python·机器学习
冰西瓜6009 小时前
深度学习的数学原理(十)—— 权重如何自发分工
人工智能·深度学习·计算机视觉
niuniudengdeng9 小时前
基于时序上下文编码的端到端无文本依赖语音分词模型
人工智能·数学·算法·概率论
Soonyang Zhang10 小时前
flashinfer attention kernel分析
人工智能·算子·推理框架
林籁泉韵710 小时前
2026年GEO服务商推荐:覆盖多场景适配,助力企业AI时代增长
人工智能