编解码器架构

一、定义

0、机器翻译是序列转换模型的一个核心问题, 其输入和输出都是长度可变的序列。 为了处理这种类型的输入和输出, 我们设计一个包含两个主要组件的架构:

第一个组件是一个编码器(encoder): 它接受一个长度可变的序列作为输入, 并将其转换为具有固定形状的编码状态。

第二个组件是解码器 (decoder): 它将固定形状的编码状态映射到长度可变的序列。 这被称为编码器-解码器(encoder-decoder)架构。

编解码器架构,模型分为两块:编码器处理输入,解码器处理输出

1、对于CNN:就是先做特征提取,然后在输出层做预测

(1)编码器:将输入编程为中间表达形式(特征)-将文本表示成向量

(2)解码器:将中间表示解码成输出-向量表示成输出

二、代码

1、编码器

复制代码
from torch import nn

#@save
class Encoder(nn.Module):
    """编码器-解码器架构的基本编码器接口"""
    def __init__(self, **kwargs):
        super(Encoder, self).__init__(**kwargs)

    def forward(self, X, *args):
        raise NotImplementedError

2、解码器

复制代码
#@save
class Decoder(nn.Module):
    """编码器-解码器架构的基本解码器接口"""
    def __init__(self, **kwargs):
        super(Decoder, self).__init__(**kwargs)

    def init_state(self, enc_outputs, *args):
        raise NotImplementedError

    def forward(self, X, state):
        raise NotImplementedError

3、合并编解码器

复制代码
#@save
class EncoderDecoder(nn.Module):
    """编码器-解码器架构的基类"""
    def __init__(self, encoder, decoder, **kwargs):
        super(EncoderDecoder, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def forward(self, enc_X, dec_X, *args):
        enc_outputs = self.encoder(enc_X, *args)
        dec_state = self.decoder.init_state(enc_outputs, *args)
        return self.decoder(dec_X, dec_state)

三、小结

1、"编码器-解码器"架构可以将长度可变的序列作为输入和输出,因此适用于机器翻译等序列转换问题。

2、编码器将长度可变的序列作为输入,并将其转换为具有固定形状的编码状态。

3、解码器将具有固定形状的编码状态映射为长度可变的序列。

相关推荐
hmywillstronger3 分钟前
【Python】【Rhino】assign column mark into bearing area‘s user text attributing
开发语言·python
liulilittle6 分钟前
_mm_aeskeygenassist_si128 硬件指令执行的操作
开发语言·c++·aes
喵~来学编程啦12 分钟前
【全队项目】从GAN到ESRGAN的超分辨率处理
开发语言·python·算法
univerbright14 分钟前
工业视觉应用开发教程(一)
人工智能·python·工业视觉
IT艺术家-rookie19 分钟前
golang--具名返回值、匿名返回值与 defer 语句之间的关系,以及 panic 对它们的影响
开发语言·golang
web守墓人21 分钟前
【go】(仅思路)使用go实现一款简单的关系型数据库gosql
开发语言·数据库·golang
寄思~28 分钟前
Tkinter --按钮点击事件应用场景
开发语言·笔记·python·学习
白仑色1 小时前
在 Java 中操作 Map时,高效遍历和安全删除数据
java·开发语言·安全
刚入坑的新人编程1 小时前
C++智能指针(详细解答)
开发语言·c++