Transformer和LLM前沿内容(1):Transformer and LLM(注定成为经典)

视频链接:bilibi

本系列将会介绍Transformer基础知识和Large Language Model前沿内容,今天记录的内容来自于MIT Song Han老师课程内容。

文章目录

    • [1. Transformer basics](#1. Transformer basics)
      • [1.1 Pre-Transformer Era](#1.1 Pre-Transformer Era)
      • [1.2 Transformer(重点)](#1.2 Transformer(重点))
        • [1.2.1 Tokenize words (word -> tokens)](#1.2.1 Tokenize words (word -> tokens))
        • [1.2.2 Word Representation](#1.2.2 Word Representation)
        • [1.2.3 Multi-Head Attention (MHA)](#1.2.3 Multi-Head Attention (MHA))
        • [1.2.4 Feed-Forward Network (FFN)](#1.2.4 Feed-Forward Network (FFN))
        • [1.2.5 LayerNorm & Residual connection](#1.2.5 LayerNorm & Residual connection)
        • [1.2.6 Position Encoding (PE)](#1.2.6 Position Encoding (PE))
    • [2. Transformer Design Variants](#2. Transformer Design Variants)
    • 3.
    • 4.

1. Transformer basics

1.1 Pre-Transformer Era







1.2 Transformer(重点)

1.2.1 Tokenize words (word -> tokens)



1.2.2 Word Representation



1.2.3 Multi-Head Attention (MHA)





1.2.4 Feed-Forward Network (FFN)


1.2.5 LayerNorm & Residual connection



1.2.6 Position Encoding (PE)




2. Transformer Design Variants

3.

4.

相关推荐
vanuan7 小时前
MCP协议实战(Java版):用Spring Boot让AI直接查你的数据库
人工智能
雪隐8 小时前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
Coffeeee8 小时前
帮你快速理解AI Agent之我想招个Android实习生
android·人工智能·agent
新新技术迷8 小时前
AI聊天自动跟随滚动,附回到底部按钮
人工智能
先锋部队8 小时前
用Web Worker解析AI返回的大文本不卡UI
人工智能
把你拉进白名单8 小时前
8.OpenClaw源码解析——三层洋葱重试
人工智能·llm·agent
用户632415031788 小时前
拖文档进AI对话框解析,前端要处理哪些脏活
人工智能
姗姗来迟了8 小时前
AI回答里的引用来源卡片,前端怎么做
人工智能
用户7106207733409 小时前
Codex-端口配置错误排查案例(stream disconnected before completion)
人工智能
IT_陈寒10 小时前
JavaScript的默认参数挖坑实录,我掉进去了
前端·人工智能·后端