pytorch链式法则

目录

  • [1. 主要的法则](#1. 主要的法则)
  • [2. 基本的法则](#2. 基本的法则)
  • [3. 链式法则](#3. 链式法则)
  • [4. pytorch验证链式法则](#4. pytorch验证链式法则)

1. 主要的法则

如下图:

链式法则的就是一级一级的求导,比如:y对x求导,首先计算y对中间变量u的导数,然后再乘以u对x的导数

2. 基本的法则

  • f + g
    y = x 2 x^2 x2 + x = 2x +1
  • f - g
    y = x 3 x^3 x3 - 3x = 3x - 3
  • 𝑓𝑔 ′ = 𝑓′𝑔 + 𝑓𝑔′
    x 4 1 x^{4^1} x41 = x 2 1 x^{2^1} x21x 2 x^2 x2 + x 2 x^2 x2 x 2 1 x^{2^1} x21 = 2x * x 2 x^2 x2 + x 2 x^2 x2 * 2x = 2 x 3 x^3 x3 + 2 x 3 x^3 x3 = 4 x 3 x^3 x3
  • softmax求导

    之前推导过,这里就不详述了。

3. 链式法则

如下图:

y对x求导,先计算y对中间变量u的导数,再乘以u对x的导数

u是中间层又叫隐藏层

由于 y 2 y_2 y2 = (x w 1 w_1 w1 + b 1 b_1 b1) * w 2 w_2 w2 + b 1 b_1 b1比较简单也可直接展开,但是对于有激活函数的式子直接展开就比较复杂了,因此还是要使用链式法则比较好。

e对w求导,经过了两级,一级一级求导即可。

4. pytorch验证链式法则

如下图:

从图中可以看出链式法则结果与pytorch自动求导结果一致,证明链式法则有效。

相关推荐
字节跳动数据库6 小时前
文章分享——相似函数处理方法
人工智能·后端·程序员
Bigfish_coding6 小时前
前端转agent-【python】-12 LangChain 入门实战:RAG + LCEL 链式调用
人工智能
程序员cxuan7 小时前
读懂 Claude Code 架构分析系列,第一篇,开始!
人工智能·后端·架构
ZhengEnCi7 小时前
P2L-Matplotlib饼图完全指南-从数据可视化到图表定制的Python绘图利器
python·matlab
曲幽7 小时前
你的REST接口还在“过度投喂”数据吗?——FastAPI + GraphQL实战避坑指南
python·fastapi·web·graphql·route·cors·rest·strawberry
饼干哥哥7 小时前
扣子3.0测评:我让 Codex 和 Claude Code 住同一个桌面,结果它们打架了!
人工智能·开源·代码规范
Token炼金师8 小时前
IP-Adapter:解耦交叉注意力如何让扩散模型看见图像
人工智能
Bigfish_coding8 小时前
前端转agent-【python】-11 LangGraph 高级特性:时间旅行与人工介入
人工智能
Token炼金师8 小时前
从safetensors到像素:ComfyUI Checkpoint加载机制的底层拆解
人工智能
AI闲人8 小时前
AI 写代码越来越快,为什么 Code Review 反而更慢了?
人工智能·code review·ai 编程