encoder和decoder结构

1. 编码器(Encoder):

  • 编码器处理输入数据(例如,句子中的词序列),并将其压缩成一个固定大小的上下文向量或一系列上下文向量。
  • 这一部分通常由多层递归神经网络(RNNs)、长短期记忆网络(LSTMs)、门控循环单元(GRUs)或最近的Transformer网络组成。
  • 编码器逐步读取输入序列,并在每一步更新其隐藏状态。最终的隐藏状态或一系列隐藏状态就包含了输入序列的信息。

2. 上下文向量(Context Vector):

  • 上下文向量是输入序列的压缩表示。在传统的编码器-解码器模型中,这是一个单一的向量,但在更先进的模型如基于注意力机制的模型中,它可以是一系列向量。
  • 该向量作为输入数据的摘要,解码器将使用它来生成输出。

3. 解码器(Decoder):

  • 解码器接收编码器生成的上下文向量(或多个向量),逐步生成输出序列。
  • 与编码器类似,解码器可以由RNNs、LSTMs、GRUs或Transformers组成。
  • 解码器在生成输出序列的每一个标记时,会参考上下文向量和已生成的标记。
  • 在机器翻译等任务中,解码器一次预测一个词,并将其输出反馈给自身,以预测下一个词。

注意力机制(Attention Mechanism)(可选但常用):

  • 在许多现代的编码器-解码器架构中,使用注意力机制使解码器在生成每个输出标记时可以关注输入序列的不同部分。
  • 通过注意力机制,解码器可以访问编码器生成的整个隐藏状态序列,并在每个解码步骤中对它们进行不同的加权。
相关推荐
FL16238631291 小时前
电力设备红外图像与可见光图像配准数据集227对共454张无标注
深度学习
LaughingZhu2 小时前
Product Hunt 每日热榜 | 2026-04-27
人工智能·经验分享·深度学习·产品运营
LaughingZhu3 小时前
Product Hunt 每日热榜 | 2026-04-26
人工智能·经验分享·深度学习·百度·产品运营
DogDaoDao3 小时前
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病
人工智能·深度学习·程序员·大模型·github·ai编程·andrej-karpathy
LaughingZhu4 小时前
Product Hunt 每日热榜 | 2026-04-29
人工智能·经验分享·深度学习·神经网络·产品运营
β添砖java4 小时前
深度学习(17)卷积层里的多输入多输出通道
人工智能·pytorch·深度学习
LaughingZhu6 小时前
Product Hunt 每日热榜 | 2026-04-30
人工智能·经验分享·深度学习·神经网络·产品运营
STLearner7 小时前
SIGIR 2026 | LLM × Graph论文总结(图增强LLM,GraphRAG,Agent,多模态,知识图谱,搜索,推
人工智能·python·深度学习·神经网络·机器学习·数据挖掘·知识图谱
老陈说编程7 小时前
12. LangChain 6大核心调用方法:invoke/stream/batch同步异步全解析,新手也能轻松学会
开发语言·人工智能·python·深度学习·机器学习·ai·langchain
AI医影跨模态组学8 小时前
如何将CT影像语义特征与肝癌术后辅助TACE获益相关的免疫抑制性肿瘤微环境建立关联,并进一步解释其与预后、PA-TACE治疗响应的机制联系
人工智能·深度学习·论文·医学·医学影像·影像组学