每天五分钟玩转深度学习PyTorch:基于pytorch搭建LSTM和GRU模型

本文重点

前面我们学习了使用pytorch搭建RNN,本文我们学习如何使用pytorch搭建LSTM和GRU模型,我们来看一下,它们两个和LSTM和GRU有什么不同。

搭建LSTM

我们可以看到模型的搭建和RNN没什么区别,关键在于它的前向传播的返回值,out和hn和RNN表示的含义一样,多了一个cn,cn和hn的维度一样的都是[层数*方向,batch,hidden-size]

除此之外,LSTM和RNN的区别还体现在参数维度上,LSTM的参数维度是RNN的四倍,可以理解为wxh的维度为(hidden_len*4,feature_len)

out表示最上层每个时刻的输出,如果要是获取最后一个时刻可以[-1,::]

Cn表示最后一个时刻的长期状态(所有层),有两层的话,那么中间层也会获取到

hn表示最后一个时刻的隐藏状态(所有层)

搭建GRU

hidden的维度是[层数*方向,batch,hidden-size]

除此之外,GRU和RNN的区别还体现在参数维度上,GRU的参数维度是RNN的四倍,可以理解为wxh的维度为(hidden_len*4,feature_len)

相关推荐
意.远11 分钟前
PyTorch模型构造实战:从基础到复杂组合
人工智能·pytorch·python·深度学习·神经网络·机器学习
致Great16 分钟前
AI代理是大模型实现可扩展智能自动化的关键
运维·人工智能·自动化·大模型·agent
戈云 110621 分钟前
人工智能图像识别Spark Core3
人工智能·spark·scala
hts000027 分钟前
DeepSeek低成本部署的原理探索
人工智能
tinker1 小时前
[Toturial] ComfyUI + Controlnet 控制生图
人工智能
yu_xiaoxian1 小时前
深度学习理论-直观理解 Attention
人工智能·llm
续亮~1 小时前
Spring AI 结构化输出详解
java·人工智能·spring·格式化输出
小机学AI大模型1 小时前
【深度学习基础】神经网络入门:从感知机到反向传播
人工智能·深度学习·神经网络
大雄野比1 小时前
【scikit-learn基础】--『预处理』之 分类编码
人工智能·分类·scikit-learn
腾讯云开发者2 小时前
“破解”GPT-4o生图技术:万物皆可吉卜力的技术路线推测
人工智能