【pytorch】张量求导

笔者看到了这篇文章,可以很好的解释张量的求导问题:

看到了上面这张图,可以说很好的表示了前向和反向的过程了。

补充几个细节

之前看李沐的d2l,一直不懂为什么矩阵计算时的一些奇奇怪怪的规定,比如为什么一个行向量对另一个行向量作微分的结果是每一行都对第二个向量的每个元素都进行偏微分,然后拼成一个矩阵。按照作者提到的,首先将y中的每个元素都对向量进行微分,然后再拼成一个矩阵。

另外一个就是:为什么两个向量微分之后的形状是两个向量的形状直接拼起来,从文中作者的解释也可以看出,每个元素都对第二个向量作微分,形状和第二个向量相同,而每个结果都会作为第一个向量的元素,因为最后一维往往就是元素,所以效果就相当于两个向量拼起来。

作者没更矩阵部分的内容,好可惜哦。

相关推荐
-To be number.wan2 分钟前
Python数据分析:时间序列数据分析
开发语言·python·数据分析
星爷AG I12 分钟前
11-7 因果(AGI基础理论)
人工智能·agi
EchoMind-Henry25 分钟前
EchoMindBot_v1.0.0 发布了
人工智能·ai·ai agent 研发手记
BlockWay26 分钟前
西甲赛程搬进平台:WEEX以竞猜开启区域合作落地
大数据·人工智能·算法·安全
HelloWorld__来都来了27 分钟前
2026.2.16 上周科研/学术热点 & 写作Ideas
人工智能·学术
Faker66363aaa30 分钟前
YOLO13-C3K2-AdditiveBlock:水果质量智能检测系统_3
python
过期的秋刀鱼!34 分钟前
神经网络-代码中的推理
人工智能·深度学习·神经网络
User_芊芊君子39 分钟前
WebSocket实时通信入门,感谢我的好搭档脉脉
网络·人工智能·websocket·网络协议·测评
KG_LLM图谱增强大模型1 小时前
OpenClaw创始人官宣加入OpenAI:从开源项目到AI智能体革命-附128页电子书OpenClaw入门到精通及安装部署指南
人工智能·开源
Asher阿舍技术站1 小时前
【AI基础学习系列】四、Prompt基础知识
人工智能·学习·prompt