技术栈
q k v
指掀涛澜天下惊
2 天前
人工智能
·
深度学习
·
机器学习
·
transformer
·
q k v
AI 基础知识十三 Transformer注意力机制(Attention)
Transformer 的核心是自注意力与多头注意力,让序列每个位置都能动态关注全局相关信息,并行捕捉长程依赖。
我是有底线的