mxnet.gluon.rnn及mxnet.symbol实现LSTM教程

基于mxnet.symbol的基本使用以及模型加载与保存
mxnet基本使用以及模型加载与保存
mxnet.symbolRNN-GRU-LSTM-Bi官网教程
基于mxnet的LSTM实现(mx.rnn.LSTMCell+symbol)

基于mxnet.gluon.rnn的基本使用以及模型加载与保存
LSTM Mxnet Implementation-手写
mxnet.gluon.rnn.LSTM中文教程
mxnet.gluon.rnn.GRU官网教程

模型导出

python 复制代码
import mxnet as mx
hidden_size = 128
num_layer = 2
word_emb_dim = 128
seq_len = 64
layer = mx.gluon.rnn.GRU(hidden_size, num_layer, bidirectional=True, )
layer.initialize()
# seq_len = 5 batch_size = 3 input_size = 128
input = mx.nd.random.uniform(shape=(seq_len, 3, word_emb_dim))
# by default zeros are used as begin state
output = layer(input)
# manually specify begin state.
# num_layers = 6 batch_size = 3 num_hidden = 128
h0 = mx.nd.random.uniform(shape=(num_layer*2, 3, hidden_size))
output, hn = layer(input, h0)
# 模型保存
layer.export('model')
# 模型加载
sym = mx.sym.load('model-symbol.json')
mod = mx.mod.Module(symbol=sym, context=mx.cpu(), label_names=None)
mod.bind(data_shapes=[('data', (5, 3, hidden_size))])
mod.load_params('model-0000.params')
print('Load Successfully!')

MXNet/Gluon:网络和参数的存取方式

相关推荐
带电的小王4 天前
【大模型基础_毛玉仁】1.2 基于RNN的语言模型
人工智能·rnn·语言模型·大语言模型基础·大模型基础_毛玉仁
青云交7 天前
Java 大视界 -- Java 大数据在智能安防入侵检测与行为分析中的应用(108)
java·大数据·lstm·联邦学习·入侵检测·实时流处理·智能安防
邪恶的贝利亚7 天前
神经网络之RNN和LSTM(基于pytorch-api)
rnn·深度学习·transformer
小宇爱7 天前
54、深度学习-自学之路-自己搭建深度学习框架-15、解释梯度消失和梯度爆炸的问题。
人工智能·rnn·深度学习·神经网络
小宇爱8 天前
57、深度学习-自学之路-自己搭建深度学习框架-18、RNN神经网络的简介
人工智能·rnn·深度学习
lihuhelihu8 天前
RNN实现精神分裂症患者诊断(pytorch)
人工智能·pytorch·rnn·深度学习·神经网络·机器学习·数据分析
小宇爱8 天前
58、深度学习-自学之路-自己搭建深度学习框架-19、RNN神经网络梯度消失和爆炸的原因(从公式推导方向来说明),通过RNN的前向传播和反向传播公式来理解。
rnn·深度学习·神经网络
Luis Li 的猫猫8 天前
深度学习五大模型:CNN、Transformer、BERT、RNN、GAN详细解析
经验分享·rnn·深度学习·机器学习·cnn·transformer
橙子小哥的代码世界9 天前
【深度学习】循环神经网络案例讲解-基于 PyTorch 的中文歌词生成——RNN,LSTM,GRU 从数据预处理到预测全流程详解
rnn·深度学习·机器学习·gru·lstm·循环神经网络·文本生成
好评笔记10 天前
深度学习笔记——循环神经网络RNN
人工智能·rnn·深度学习·机器学习·计算机视觉·面试·aigc