【pytorch】张量求导

笔者看到了这篇文章,可以很好的解释张量的求导问题:

看到了上面这张图,可以说很好的表示了前向和反向的过程了。

补充几个细节

之前看李沐的d2l,一直不懂为什么矩阵计算时的一些奇奇怪怪的规定,比如为什么一个行向量对另一个行向量作微分的结果是每一行都对第二个向量的每个元素都进行偏微分,然后拼成一个矩阵。按照作者提到的,首先将y中的每个元素都对向量进行微分,然后再拼成一个矩阵。

另外一个就是:为什么两个向量微分之后的形状是两个向量的形状直接拼起来,从文中作者的解释也可以看出,每个元素都对第二个向量作微分,形状和第二个向量相同,而每个结果都会作为第一个向量的元素,因为最后一维往往就是元素,所以效果就相当于两个向量拼起来。

作者没更矩阵部分的内容,好可惜哦。

相关推荐
m0_380167145 分钟前
面向开发者的Top10加密货币数据API(2026年最新)
大数据·人工智能·区块链
yyxx4121237 分钟前
上海企业如何选择专业的钉钉服务商
java·大数据·人工智能·钉钉
未来和明天7 分钟前
领嵌iLeadE-588边缘计算盒子,兼容Modbus、DLT645、OPC UA等多种行业协议,支持第三方平台对接。
人工智能·边缘计算
幂律智能16 分钟前
盖章是合同的开始,那最后一步是什么
人工智能
jay神17 分钟前
基于 FastAPI + Vue 的宠物领养管理系统
前端·vue.js·python·毕业设计·fastapi·宠物
大山佬17 分钟前
RTOS 内存管理:从静态分配到堆碎片治理的工程实践
人工智能
chase_my_dream19 分钟前
Cartographer详细讲解
c++·人工智能·自动驾驶
AIHR数智引擎23 分钟前
KPI物理失效:AI原生组织的效能重构与技能度量
人工智能·经验分享·职场和发展·重构·ai-native·aihr
β添砖java28 分钟前
深度学习(22)网络中的网络NiN
人工智能·深度学习
昵称好难啊34 分钟前
7.OpenClaw源码解析——可靠消息投递
人工智能·llm·agent