技术栈

q k v

指掀涛澜天下惊
2 天前
人工智能·深度学习·机器学习·transformer·q k v
AI 基础知识十三 Transformer注意力机制(Attention)Transformer 的核心是自注意力与多头注意力,让序列每个位置都能动态关注全局相关信息,并行捕捉长程依赖。
我是有底线的