pytorch-pytorch之LSTM

目录

  • [1. nn.LSTM](#1. nn.LSTM)
  • [2. nn.LSTMCell](#2. nn.LSTMCell)

1. nn.LSTM

初始化函数输入参数与RNN相同,分别是input_size,hidden_size和num_layer

foward函数也与RNN类似,只不过返回值除了out外,ht变为(ht,ct)

代码见下图:

2. nn.LSTMCell

初始化函数输入参数与nn.LSTM类似

forward函数与nn.LSTM的区别是没有out

单层代码如下图:

和RNN的Cell类似,Cell单元循环更新h,c

2层无非就是多创建了一个cell2、h2、c2,并同时循环更新h1,c1,h2,c2,多层以此类推。

相关推荐
小爷毛毛_卓寿杰18 分钟前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github
秦先生在广东19 分钟前
Agent 闭环才是真正的护城河:Anthropic “300 个 Agent“ 背后被忽视的秘密
人工智能
Bigfish_coding21 分钟前
前端转agent-【python】- 14 记忆系统优化:摘要与遗忘
人工智能
Bigfish_coding31 分钟前
前端转agent-【python】-13 Ollama Python流式输出教程:stream=True 与 async 实践
人工智能
字节跳动数据库3 小时前
文章分享——相似函数处理方法
人工智能·后端·程序员
Bigfish_coding3 小时前
前端转agent-【python】-12 LangChain 入门实战:RAG + LCEL 链式调用
人工智能
程序员cxuan3 小时前
读懂 Claude Code 架构分析系列,第一篇,开始!
人工智能·后端·架构
饼干哥哥4 小时前
扣子3.0测评:我让 Codex 和 Claude Code 住同一个桌面,结果它们打架了!
人工智能·开源·代码规范
Token炼金师4 小时前
IP-Adapter:解耦交叉注意力如何让扩散模型看见图像
人工智能
Bigfish_coding4 小时前
前端转agent-【python】-11 LangGraph 高级特性:时间旅行与人工介入
人工智能