深度学习----------------------------编码器、解码器架构

目录

重新考察CNN

编码器:将输入编码成中间表达形式(特征)

解码器:将中间表示解码成输出。


重新考察RNN

编码器:将文本 表示成向量

解码器:向量 表示成输出


编码器-解码器架构

一个模块被分为两块

编码器处理输出
解码器生成输出


总结

使用编码器-解码器架构的模型,编码器负责表示输入,解码器负责输出。


编码器=解码器架构

编码器

python 复制代码
# 编码器
from torch import nn


class Encoder(nn.Module):
    """编码器-解码器结构的基本编码器接口"""

    #  Encoder 类的构造函数,它接受任意数量的关键字参数
    def __init__(self, **kwargs):
        # 调用了父类 nn.Module 的构造函数,确保正确初始化
        super(Encoder, self).__init__(**kwargs)

    # 给一个X,输出其状态

    def forward(self, X, *args):
        # 抛出一个 NotImplementedError 异常,表示该方法需要在子类中进行实现。
        raise NotImplementedError

解码器

python 复制代码
# 解码器
class Decoder(nn.Module):
    def __init__(self, **kwargs):
        super(Decoder, self).__init__(**kwargs)

    # 有一个中介状态,编码器的东西传给解码器,拿到编码器的输出enc_outputs,然后初始化状态。

    def init_state(self, enc_outputs, *args):
        raise NotImplementedError

    # 拿到额外的输出X, state是用来不断更新的

    def forward(self, X, state):
        raise NotImplementedError

合并编码器和解码器

python 复制代码
# 编码器
from torch import nn


# 合并编码器和解码器
class EncoderDecoder(nn.Module):
    """编码器-解码器结构的基类"""

    def __init__(self, encoder, decoder, **kwargs):
        super(EncoderDecoder, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def forward(self, enc_X, dec_X, *args):
        # 使用编码器对输入进行编码
        enc_outputs = self.encoder(enc_X, *args)
        # 使用编码器的输出初始化解码器的状态
        dec_state = self.decoder.init_state(enc_outputs, *args)
        # 使用解码器进行解码
        return self.decoder(dec_X, dec_state)

相关推荐
HyperAI超神经2 分钟前
具身智能资源汇总:机器人学习数据集,在线体验世界建模模型,英伟达/字节/小米等最新研究论文
人工智能·深度学习·学习·机器学习·机器人·ai编程·图形生成
地球没有花2 分钟前
调整warmup的batch优化tensorflow serving P99耗时毛刺
人工智能·python·tensorflow
道可云21 分钟前
道可云AI元宇宙平台入选2025年度视听系统典型案例
人工智能
AI-小柒1 小时前
从零入门大语言模型(LLM):系统学习路线与实践指南
大数据·开发语言·人工智能·学习·信息可视化·语言模型·自然语言处理
才聚PMP1 小时前
NPI项目如何用控制计划(CP)锁死 “量产一致性”?
人工智能
marteker1 小时前
现代租赁汽车的原厂锁车和解锁警报声替换成科基蛙的叫声
人工智能
remender9991 小时前
降本增效双赋能,IT人力外包成企业破局新路径
大数据·人工智能·物联网
Peter·Pan爱编程1 小时前
RegexBox:让正则表达式变得简单,AI 驱动的正则工具箱
人工智能·正则表达式
马士兵教育1 小时前
AI大模型通用智能体项目从原理到落地:Agent Skills 的核心逻辑与中间件 + 动态工具实践方案+架构项目实战!
人工智能·中间件·架构
C++ 老炮儿的技术栈1 小时前
KUKA机器人程序抓料
linux·运维·c语言·人工智能·机器人·库卡