mxnet.gluon.rnn及mxnet.symbol实现LSTM教程

基于mxnet.symbol的基本使用以及模型加载与保存
mxnet基本使用以及模型加载与保存
mxnet.symbolRNN-GRU-LSTM-Bi官网教程
基于mxnet的LSTM实现(mx.rnn.LSTMCell+symbol)

基于mxnet.gluon.rnn的基本使用以及模型加载与保存
LSTM Mxnet Implementation-手写
mxnet.gluon.rnn.LSTM中文教程
mxnet.gluon.rnn.GRU官网教程

模型导出

python 复制代码
import mxnet as mx
hidden_size = 128
num_layer = 2
word_emb_dim = 128
seq_len = 64
layer = mx.gluon.rnn.GRU(hidden_size, num_layer, bidirectional=True, )
layer.initialize()
# seq_len = 5 batch_size = 3 input_size = 128
input = mx.nd.random.uniform(shape=(seq_len, 3, word_emb_dim))
# by default zeros are used as begin state
output = layer(input)
# manually specify begin state.
# num_layers = 6 batch_size = 3 num_hidden = 128
h0 = mx.nd.random.uniform(shape=(num_layer*2, 3, hidden_size))
output, hn = layer(input, h0)
# 模型保存
layer.export('model')
# 模型加载
sym = mx.sym.load('model-symbol.json')
mod = mx.mod.Module(symbol=sym, context=mx.cpu(), label_names=None)
mod.bind(data_shapes=[('data', (5, 3, hidden_size))])
mod.load_params('model-0000.params')
print('Load Successfully!')

MXNet/Gluon:网络和参数的存取方式

相关推荐
跳跳糖炒酸奶6 天前
第二章、LSTM(Long Short-term Memory:长短时记忆网络)
人工智能·rnn·深度学习·神经网络·lstm
绕灵儿8 天前
C++ 部署LSTM(.onnx)
开发语言·c++·lstm
机器学习之心8 天前
灰狼算法+四模型对比!GWO-CNN-LSTM-Attention系列四模型多变量时序预测
算法·cnn·lstm·gwo-cnn-lstm
无名工程师10 天前
浅谈RNN被Transformer 取代的必然性
rnn·学习·transformer
星马梦缘10 天前
RNN梯度爆炸/消失的杀手锏——LSTM与GRU
人工智能·rnn·深度学习·gru·lstm·长短期记忆
weixin_4569042710 天前
PyTorch RNN 名字分类器
人工智能·pytorch·rnn
程序员秘密基地13 天前
基于html,css,jquery,django,lstm,cnn,tensorflow,bert,推荐算法,mysql数据库
python·cnn·tensorflow·lstm·推荐算法
lishaoan7713 天前
实现RNN(一): SimpleRNN
人工智能·rnn·深度学习
wow_DG15 天前
【Pytorch✨】LSTM01 入门
人工智能·pytorch·lstm
老鱼说AI17 天前
循环神经网络RNN原理精讲,详细举例!
人工智能·rnn·深度学习·神经网络·自然语言处理·语音识别