mxnet.gluon.rnn及mxnet.symbol实现LSTM教程

基于mxnet.symbol的基本使用以及模型加载与保存
mxnet基本使用以及模型加载与保存
mxnet.symbolRNN-GRU-LSTM-Bi官网教程
基于mxnet的LSTM实现(mx.rnn.LSTMCell+symbol)

基于mxnet.gluon.rnn的基本使用以及模型加载与保存
LSTM Mxnet Implementation-手写
mxnet.gluon.rnn.LSTM中文教程
mxnet.gluon.rnn.GRU官网教程

模型导出

python 复制代码
import mxnet as mx
hidden_size = 128
num_layer = 2
word_emb_dim = 128
seq_len = 64
layer = mx.gluon.rnn.GRU(hidden_size, num_layer, bidirectional=True, )
layer.initialize()
# seq_len = 5 batch_size = 3 input_size = 128
input = mx.nd.random.uniform(shape=(seq_len, 3, word_emb_dim))
# by default zeros are used as begin state
output = layer(input)
# manually specify begin state.
# num_layers = 6 batch_size = 3 num_hidden = 128
h0 = mx.nd.random.uniform(shape=(num_layer*2, 3, hidden_size))
output, hn = layer(input, h0)
# 模型保存
layer.export('model')
# 模型加载
sym = mx.sym.load('model-symbol.json')
mod = mx.mod.Module(symbol=sym, context=mx.cpu(), label_names=None)
mod.bind(data_shapes=[('data', (5, 3, hidden_size))])
mod.load_params('model-0000.params')
print('Load Successfully!')

MXNet/Gluon:网络和参数的存取方式

相关推荐
.30-06Springfield15 小时前
利用人名语言分类案例演示RNN、LSTM和GRU的区别(基于PyTorch)
人工智能·pytorch·python·rnn·分类·gru·lstm
suixinm10 天前
LSTM、GRU 与 Transformer网络模型参数计算
gru·lstm·transformer
是纯一呀10 天前
融合LSTM与自注意力机制的多步光伏功率预测新模型解析
人工智能·lstm·transformer·预测
AI扶我青云志11 天前
ANN、CNN、RNN 深度解析
rnn·深度学习·cnn
野生的程序媛11 天前
第三章 卷积神经网络
人工智能·rnn·深度学习·神经网络·机器学习·语言模型·cnn
weixin_5079299111 天前
R4 LSTM-火灾温度预测
人工智能·lstm
boooo_hhh13 天前
第32周———Tensorflow|LSTM-火灾温度预测
人工智能·tensorflow·lstm
suixinm14 天前
Word2Vec介绍
rnn·深度学习·机器翻译
深度学习_乌冬面15 天前
RNN为什么不适合大语言模型
人工智能·rnn·语言模型
24毕业生从零开始学ai15 天前
循环神经网络(RNN):序列数据处理的强大工具
人工智能·rnn·深度学习