深度学习---------------------------深度循环神经网络

目录

回顾:循环神经网络


RNN就一个隐藏的层,无法做的很宽,所以一般的做法是做的更深。(更深的时候是说每一层做一点点的非线性。)

怎么样把循环网络变深?怎么样获得更多的非线性

多加几个隐藏层

更深:



当前的第一个隐藏层 H t 1 H_{t}^{1} Ht1,第j层就是 H t j H_{t}^{j} Htj等于 f j f_j fj下(第j层的上一个时刻的H,第j-1层时刻的隐藏状态)


总结

深度循环神经网络使用多个隐藏层来获得更多的非线性性。


深度循环神经网络代码

python 复制代码
from torch import nn
from d2l import torch as d2l

batch_size, num_steps = 32, 35
# 将数据集划分为以batch_size为批量大小,num_steps为时间步数的小批量数据
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)
# 设置隐藏层数为2,即num_layers
vocab_size, num_hiddens, num_layers = len(vocab), 256, 2
# 将输入的维度设置为词汇表的大小,用于将词汇表中的词转换为嵌入向量
num_inputs = vocab_size
device = d2l.try_gpu()
# 创建 LSTM 层
lstm_layer = nn.LSTM(num_inputs, num_hiddens, num_layers)
model = d2l.RNNModel(lstm_layer, len(vocab))
model = model.to(device)
num_epochs, lr = 500, 2
d2l.train_ch8(model, train_iter, vocab, lr, num_epochs, device)
d2l.plt.show()


相关推荐
Rubin智造社15 小时前
安全先行·自主编程|Claude Code Opus 4.7深度解读:AI开发进入合规量产时代
人工智能·anthropic·claude opus 4.7·mythos preview·xhigh努力等级·/ultrareview命令·自主开发ai
xinlianyq15 小时前
全球 AI 芯片格局生变:英伟达主导训练,国产算力崛起推理
人工智能
ShineWinsu15 小时前
AI训练硬件指南:GPU算力梯队与任务匹配框架
人工智能
范桂飓15 小时前
精选 Skills 清单
人工智能
码农的日常搅屎棍16 小时前
AIAgent开发新选择:OpenHarness极简入门指南
人工智能
AC赳赳老秦16 小时前
OpenClaw生成博客封面图+标题,适配CSDN视觉搜索,提升点击量
运维·人工智能·python·自动化·php·deepseek·openclaw
萝卜小白16 小时前
算法实习Day04-MinerU2.5-pro
人工智能·算法·机器学习
geneculture16 小时前
从人际间性到人机间性:进入人机互助新时代——兼论融智学视域下人类认知第二次大飞跃的理论奠基与实践场域
人工智能·融智学的重要应用·哲学与科学统一性·融智时代(杂志)·人际间性·人机间性·人际间文性
东方品牌观察16 小时前
观澜社张庆解析AI:便利与挑战并存
人工智能
w_t_y_y16 小时前
Agent 开发框架(一)有哪些框架&&A2A协议
人工智能