聊聊RNN与seq2seq

seq2seq模型也称为Encoder-Decoder模型。顾名思义,这个模型有两个模块------Encoder(编码器)和Decoder(解码器)。编码器对输入数据进行编码,解码器对被编码的数据进行解码。此时编码器编码的信息浓缩了翻译所必需的信息,解码器基于这个浓缩的信息生成目标文本。

这里的数据一般指时序数据,即按时间顺序记录的数据列,具有可比性和结构化性。

编码器

以RNN为例,设计一个编码器结构如下

编码器利用RNN将时序数据转换为隐藏状态h。这里的RNN使用的是LSTM模型,编码器输出的向量h是LSTM层的最后一个隐藏状态,其中编码了翻译输入文本所需的信息。

解码器

LSTM层会接收编码器层最后隐藏状态输出的向量h。上一个层的输出预测会作为下一个层的输入参数,如此循环下去。

这一分隔符(特殊符号)。这个分隔符被用作通知解码器开始生成文本的信号。另外,解码器采样到 出现为止,所以它也是结束信号。也就是说,分隔符 可以用来指示解码器的"开始/结束"。

整体结构

连接编码器和解码器后的seq2seq整体结构如下,可以看出seq2seq是组合了两个RNN的神经网络。

对于seq2seq序列模型更多解释可看 博客

相关推荐
池央1 天前
ops-nn 算子库中的数据布局与混合精度策略:卷积、矩阵乘法与 RNN 的优化实践
rnn·线性代数·矩阵
爱打代码的小林2 天前
循环网络RNN--评论内容情感分析
人工智能·rnn·深度学习
童话名剑3 天前
序列模型与集束搜索(吴恩达深度学习笔记)
人工智能·笔记·深度学习·机器翻译·seq2seq·集束搜索·编码-解码模型
Network_Engineer3 天前
从零手写RNN&BiRNN:从原理到双向实现
人工智能·rnn·深度学习·神经网络
海天一色y4 天前
使用 PyTorch RNN 识别手写数字
人工智能·pytorch·rnn
一招定胜负4 天前
从RNN到LSTM:循环神经网络的进化之路
人工智能·rnn·深度学习
Mr.huang5 天前
RNN系列模型演进及其解决的问题
人工智能·rnn·lstm
翱翔的苍鹰5 天前
法律问答机器人”技术方案”的实现
人工智能·rnn·深度学习·自然语言处理
All The Way North-6 天前
彻底掌握 RNN(实战):PyTorch API 详解、多层RNN、参数解析与输入机制
pytorch·rnn·深度学习·循环神经网络·参数详解·api详解
Jiede16 天前
LSTM详细介绍(基于股票收盘价预测场景)
人工智能·rnn·lstm