《动手学深度学习》-58深层循环神经网络实现

在此基础上加多几层隐藏层

复制代码
import torch
from torch import nn
from torch.nn import functional as F
import test_55RNNesay_realize
import d2l
import test_53LanguageModel
import test_55RNNdifficult_realize
batch_size,num_steps=32,35
train_iter,vocab=test_53LanguageModel.load_data_time_machine(batch_size,num_steps)
vocab_size,num_hiddens,num_layers=len(vocab),512,2
num_inputs=vocab_size
lr,num_epochs=0.1,500
device=d2l.try_gpu()
lstm=nn.LSTM(num_inputs,num_hiddens,num_layers)
model=test_55RNNesay_realize.RNNModel(lstm,len(vocab))
model=model.to(d2l.try_gpu())
test_55RNNdifficult_realize.train_ch8(model,train_iter,vocab,lr,num_epochs,device)
相关推荐
Juicedata4 小时前
JuiceFS 企业版 5.3 特性详解:单文件系统支持超 5,000 亿文件,首次引入 RDMA
大数据·人工智能·机器学习·性能优化·开源
我有酒两杯5 小时前
引导模型生成具有反思和验证机制的response的指令
深度学习
2301_790300965 小时前
Python单元测试(unittest)实战指南
jvm·数据库·python
VCR__5 小时前
python第三次作业
开发语言·python
韩立学长5 小时前
【开题答辩实录分享】以《助农信息发布系统设计与实现》为例进行选题答辩实录分享
python·web
码农水水5 小时前
得物Java面试被问:消息队列的死信队列和重试机制
java·开发语言·jvm·数据结构·机器学习·面试·职场和发展
小白狮ww5 小时前
Ovis-Image:卓越的图像生成模型
人工智能·深度学习·目标检测·机器学习·cpu·gpu·视觉分割模型
滴啦嘟啦哒5 小时前
【机械臂】【LLM】一、接入千问LLM实现自然语言指令解析
深度学习·ros·vla
工程师老罗5 小时前
Pytorch完整的模型训练流程
人工智能·pytorch·深度学习
2401_838472515 小时前
使用Scikit-learn构建你的第一个机器学习模型
jvm·数据库·python