Transformer的前世今生 day11(Transformer的流程)

Transformer的流程

  • 在机器翻译任务中,翻译第一个词,Transformer的流程为:
    1. 先将要翻译的句子,一个词一个词的转换为词向量送入编码器层,得到优化过的词向量以及K、V,
    2. 将K、V送入解码器层,并跟解码器层将要翻译的Q进行计算,来找出相匹配的K、V,
    3. 经过线性层和Softmax层得到最后翻译的结果,如下图:
  • 注意:翻译第一个词的时候,还没有已经生成好的词输入进解码器层
  • 在机器翻译任务中,翻译接下来的词,Transformer的流程为:
    1. 先将要翻译的句子,一个词一个词的转换为词向量送入编码器层,得到优化过的词向量以及K、V,
    2. 将K、V送入解码器层,同时,将之前已经生成的词也送入解码器层,并跟解码器层将要翻译的Q进行计算,来找出相匹配的K、V,
    3. 经过线性层和Softmax层得到最后翻译的结果,再将生成的词作为解码器层的输入再重复以上的步骤,当遇到<eos>时最后得到模型的输出,如下图:

Transformer的框架

相关推荐
九亿AI算法优化工作室&12 分钟前
乡村地区无人机医药配送路径规划与优化仿真
人工智能·算法·matlab·回归
jndingxin15 分钟前
OpenCV CUDA模块中矩阵操作-----矩阵最大最小值查找函数
人工智能·opencv
AI Echoes21 分钟前
LLM(大语言模型)部署加速方法——PagedAttention
人工智能·语言模型·自然语言处理
yangshuo128130 分钟前
风车OVF镜像:解放AI开发限制的Ubuntu精简系统
linux·人工智能·ubuntu
Jamence34 分钟前
多模态大语言模型arxiv论文略读(七十七)
人工智能·语言模型·自然语言处理
AI量化投资实验室1 小时前
金融量化智能体,如何开发一个有效的策略?
人工智能·金融
九章云极AladdinEdu1 小时前
GPU SIMT架构的极限压榨:PTX汇编指令级并行优化实践
汇编·人工智能·pytorch·python·深度学习·架构·gpu算力
数智大号1 小时前
浪潮云边协同:赋能云计算变革的强力引擎
人工智能
胡玉洋2 小时前
从新手到高手:全面解析 AI 时代的「魔法咒语」——Prompt
人工智能·ai·prompt·transformer·协议
是店小二呀2 小时前
Trae 插件 Builder 模式:从 0 到 1 开发天气查询小程序,解锁 AI 编程新体验
人工智能·ai编程·trae