Transformer的前世今生 day11(Transformer的流程)

Transformer的流程

  • 在机器翻译任务中,翻译第一个词,Transformer的流程为:
    1. 先将要翻译的句子,一个词一个词的转换为词向量送入编码器层,得到优化过的词向量以及K、V,
    2. 将K、V送入解码器层,并跟解码器层将要翻译的Q进行计算,来找出相匹配的K、V,
    3. 经过线性层和Softmax层得到最后翻译的结果,如下图:
  • 注意:翻译第一个词的时候,还没有已经生成好的词输入进解码器层
  • 在机器翻译任务中,翻译接下来的词,Transformer的流程为:
    1. 先将要翻译的句子,一个词一个词的转换为词向量送入编码器层,得到优化过的词向量以及K、V,
    2. 将K、V送入解码器层,同时,将之前已经生成的词也送入解码器层,并跟解码器层将要翻译的Q进行计算,来找出相匹配的K、V,
    3. 经过线性层和Softmax层得到最后翻译的结果,再将生成的词作为解码器层的输入再重复以上的步骤,当遇到<eos>时最后得到模型的输出,如下图:

Transformer的框架

相关推荐
DO_Community1 分钟前
LawVo 借助 DigitalOcean 扩展 AI 驱动的法律服务
人工智能
带娃的IT创业者2 分钟前
从马斯克败诉OpenAI看AI时代的契约重构与技术伦理边界
人工智能·重构·openai·马斯克·商业化·技术伦理·ai治理
Hali_Botebie2 分钟前
为什么静态3DGS+轨迹回放,可以通过强化学习训练端到端自动驾驶?
人工智能·机器学习·自动驾驶
SCKJAI3 分钟前
依托NVIDIA Cosmos 3赋能交通与安全智能升级,发布新一代智慧城市AI平台
人工智能
波动几何3 分钟前
领域消除评估技能domain-elimination-assessor
人工智能
AI科技星5 分钟前
依托Gε₀ = e²/(4παmₚ²)核心方程:全新公式推导+原创理论提炼+全维度精算验证
人工智能·线性代数·架构·概率论·学习方法
Henry Zhu1235 分钟前
从人类智能的形成机制到通用人工智能:一种具身、因果、社会化的适应系统框架
人工智能
光锥智能8 分钟前
把OpenAI按在地上摩擦,Anthropic怎么做到的?
大数据·人工智能
动物园猫8 分钟前
无人机角度的道路损害检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·无人机
河南博为智能科技有限公司8 分钟前
基于边缘计算物联网关的机房动力环境监控系统解决方案!
人工智能·物联网·边缘计算