mxnet.gluon.rnn及mxnet.symbol实现LSTM教程

基于mxnet.symbol的基本使用以及模型加载与保存
mxnet基本使用以及模型加载与保存
mxnet.symbolRNN-GRU-LSTM-Bi官网教程
基于mxnet的LSTM实现(mx.rnn.LSTMCell+symbol)

基于mxnet.gluon.rnn的基本使用以及模型加载与保存
LSTM Mxnet Implementation-手写
mxnet.gluon.rnn.LSTM中文教程
mxnet.gluon.rnn.GRU官网教程

模型导出

python 复制代码
import mxnet as mx
hidden_size = 128
num_layer = 2
word_emb_dim = 128
seq_len = 64
layer = mx.gluon.rnn.GRU(hidden_size, num_layer, bidirectional=True, )
layer.initialize()
# seq_len = 5 batch_size = 3 input_size = 128
input = mx.nd.random.uniform(shape=(seq_len, 3, word_emb_dim))
# by default zeros are used as begin state
output = layer(input)
# manually specify begin state.
# num_layers = 6 batch_size = 3 num_hidden = 128
h0 = mx.nd.random.uniform(shape=(num_layer*2, 3, hidden_size))
output, hn = layer(input, h0)
# 模型保存
layer.export('model')
# 模型加载
sym = mx.sym.load('model-symbol.json')
mod = mx.mod.Module(symbol=sym, context=mx.cpu(), label_names=None)
mod.bind(data_shapes=[('data', (5, 3, hidden_size))])
mod.load_params('model-0000.params')
print('Load Successfully!')

MXNet/Gluon:网络和参数的存取方式

相关推荐
木头左2 天前
基于LSTM与3秒级Tick数据的金融时间序列预测实现
人工智能·金融·lstm
补三补四3 天前
LSTM 深度解析:从门控机制到实际应用
人工智能·rnn·lstm
孤心亦暖3 天前
RNN,GRU和LSTM的简单实现
rnn·gru·lstm
kunwen1234 天前
机器学习、深度学习
rnn·langchain·cnn·transformer·langgraph
先做个垃圾出来………6 天前
传统模型RNN与CNN介绍
人工智能·rnn·cnn
机器学习之心8 天前
MATLAB基于GM(灰色模型)与LSTM(长短期记忆网络)的组合预测方法
matlab·lstm
程序员miki8 天前
RNN循环神经网络(一):基础RNN结构、双向RNN
人工智能·pytorch·rnn·深度学习
fantasy_arch9 天前
9.3深度循环神经网络
人工智能·rnn·深度学习
机器学习之心9 天前
分解+优化+预测!CEEMDAN-Kmeans-VMD-DOA-Transformer-LSTM多元时序预测
lstm·transformer·kmeans·多元时序预测·双分解
会写代码的饭桶9 天前
通俗理解 LSTM 的三门机制:从剧情记忆到科学原理
人工智能·rnn·lstm·transformer