Transformer - model architecture

Transformer - model architecture

flyfish

Transformer总体架构可分为四个部分:

输⼊部分

输出部分

编码器部分

解码器部分

输入部分

输出部分

输⼊部分包含:

源嵌⼊层和位置编码

⽬标嵌⼊层和位置编码

输出部分包含:

线性层

softmax处理器

左侧编码器部分和右侧解码器部分

编码器部分:

由N个编码器层堆叠⽽成

每个编码器层由两个⼦层连接结构组成

解码器部分:

由N个解码器层堆叠⽽成

每个解码器层由三个⼦层连接结构组成

相关推荐
fyakm6 分钟前
RNN的注意力机制:原理与实现(代码示例)
rnn·深度学习·神经网络
金井PRATHAMA3 小时前
描述逻辑(Description Logic)对自然语言处理深层语义分析的影响与启示
人工智能·自然语言处理·知识图谱
Rock_yzh3 小时前
AI学习日记——参数的初始化
人工智能·python·深度学习·学习·机器学习
拆房老料4 小时前
Transformer推理优化全景:从模型架构到硬件底层的深度解析
深度学习·ai·自然语言处理·transformer
CiLerLinux4 小时前
第四十九章 ESP32S3 WiFi 路由实验
网络·人工智能·单片机·嵌入式硬件
七芒星20236 小时前
多目标识别YOLO :YOLOV3 原理
图像处理·人工智能·yolo·计算机视觉·目标跟踪·分类·聚类
Learn Beyond Limits7 小时前
Mean Normalization|均值归一化
人工智能·神经网络·算法·机器学习·均值算法·ai·吴恩达
byzy7 小时前
【论文笔记】VisionPAD: A Vision-Centric Pre-training Paradigm for Autonomous Driving
论文阅读·深度学习·计算机视觉·自动驾驶
ACERT3337 小时前
5.吴恩达机器学习—神经网络的基本使用
人工智能·python·神经网络·机器学习
C嘎嘎嵌入式开发7 小时前
(一) 机器学习之深度神经网络
人工智能·神经网络·dnn