深度学习14—注意力机制与自注意力机制

注:以下均为个人学习笔记,发布只为方便学习阅读,若觉侵权,请联系删除!!

1.李沐老师课堂学习理解笔记

1.1 随意线索和不随意线索

1.2 注意力机制

通过注意力池化层来有偏向性的选择某些输入。

1.3 注意力池化层

1.3.1 非参数化注意力机制

理解: Q(query)即为随意线索 ,可以通过对值V(value)做重要性加权得到。在这里,值V(value)和不随意线索K(key)是一个对。(对应关系)。

1.3.2 参数化的注意力机制

1.4 总结

1.5 代码

2.自注意机制(self-attention)

2.1 Q,K,V的理解

2.2 Attention(Q,K,V)

2.3 代码

2.4 位置编码

2.5 多头注意力机制

相关推荐
慕木沐3 分钟前
【Spring AI + Google ADK 】流式输出时 outputKey 状态缓存失败的问题
人工智能·spring·缓存
wuhanzhanhui7 分钟前
智能工厂升级新风口,2026武汉智能工业自动化及机器人展览会引领未来
人工智能
云烟成雨TD11 分钟前
Agent Scope Java 2.x 系列【4】模型层
java·人工智能·agent
dozenyaoyida12 分钟前
AI与大模型新闻日报 | 2026-06-12
人工智能·ai·大模型·新闻
Blb12365413 分钟前
技术解析-固体绝缘材料表面电阻率测试
人工智能·功能测试·制造·材料工程
云淡风轻~窗明几净15 分钟前
角谷猜想的任意算法测试
数据结构·人工智能·算法
SaaS_Product16 分钟前
同步盘操作教程:如何自动同步文件
人工智能·云计算·saas·onedrive
Z-D-K18 分钟前
考验AI的“自我和意识“-AI对《红楼梦》后40回的改写(21)
人工智能·ai·aigc·交互·agi
CIO_Alliance20 分钟前
API激增时代,如何用iPaaS实现API全生命周期治理
人工智能·ai·ipaas·系统集成·企业ai化转型
云烟成雨TD23 分钟前
Agent Scope Java 2.x 系列【5】智能体抽象层
java·人工智能·agent