Transformer的前世今生 day11(Transformer的流程)

Transformer的流程

  • 在机器翻译任务中,翻译第一个词,Transformer的流程为:
    1. 先将要翻译的句子,一个词一个词的转换为词向量送入编码器层,得到优化过的词向量以及K、V,
    2. 将K、V送入解码器层,并跟解码器层将要翻译的Q进行计算,来找出相匹配的K、V,
    3. 经过线性层和Softmax层得到最后翻译的结果,如下图:
  • 注意:翻译第一个词的时候,还没有已经生成好的词输入进解码器层
  • 在机器翻译任务中,翻译接下来的词,Transformer的流程为:
    1. 先将要翻译的句子,一个词一个词的转换为词向量送入编码器层,得到优化过的词向量以及K、V,
    2. 将K、V送入解码器层,同时,将之前已经生成的词也送入解码器层,并跟解码器层将要翻译的Q进行计算,来找出相匹配的K、V,
    3. 经过线性层和Softmax层得到最后翻译的结果,再将生成的词作为解码器层的输入再重复以上的步骤,当遇到<eos>时最后得到模型的输出,如下图:

Transformer的框架

相关推荐
腾飞开源几秒前
07_Spring AI 干货笔记之提示词
人工智能·提示词·提示词工程·角色分配·模板渲染·spring ai·令牌机制
_codemonster4 分钟前
深度学习实战(基于pytroch)系列(三十九)门控循环单元(GRU)pytorch简洁实现
pytorch·深度学习·gru
Dev7z4 分钟前
基于深度学习的手写数学公式识别与计算系统设计与实现
人工智能·深度学习
机器不学习我也不学习5 分钟前
人工智能综合项目开发13——模型优化与调优——超参数
人工智能
n***F8757 分钟前
Spring Boot + Spring AI快速体验
人工智能·spring boot·spring
七宝大爷11 分钟前
编码器-解码器架构:理解Transformer的两种基本模式
深度学习·架构·transformer
ByteCraze12 分钟前
如何处理大模型幻觉问题?
前端·人工智能·深度学习·机器学习·node.js
LCG米12 分钟前
实战:基于ESP32-S3的微型边缘AI计算棒设计,实现低成本图像识别
人工智能
微笑伴你而行13 分钟前
LDU机器学习大作业TCR-抗原结合预测
人工智能·机器学习
丝斯201113 分钟前
AI学习笔记整理(23)—— AI核心技术(深度学习7)
人工智能·笔记·学习