矩阵的导数运算2——链式法则

假设 J = f ( y ( u ) ) J=f(y(u)) J=f(y(u)) ,已知标量复合函数对标量 的求导:
∂ J ∂ u = ∂ J ∂ y ∂ y ∂ u \frac{\partial J}{\partial u}=\frac{\partial J}{\partial y} \frac{\partial y}{\partial u} ∂u∂J=∂y∂J∂u∂y

以此类推,假设 J = f ( y → ( u → ) ) J=f(\overrightarrow{y}(\overrightarrow{u})) J=f(y (u )), y → = [ y 1 ( u → ) . . y m ( u → ) ] m × 1 \overrightarrow{y}= \begin{bmatrix} y_1(\overrightarrow{u}) \\ .\\ .\\ y_m(\overrightarrow{u})\\ \end{bmatrix}{m\times1} y = y1(u )..ym(u ) m×1, u → = [ u 1 . . u n ] n × 1 \overrightarrow{u}= \begin{bmatrix} u_1\\ .\\ .\\ u_n\\ \end{bmatrix}{n\times1} u = u1..un n×1,则标量复合函数对向量的求导(分母布局):

❌ \] ∂ J ∂ u → = ∂ J ∂ y → m × 1 ∂ y → ∂ u → n × m \[❌\] \\frac{\\partial J}{\\partial \\overrightarrow{u}}=\\frac{\\partial J}{\\partial \\overrightarrow{y}}_{m\\times 1} \\frac{\\partial \\overrightarrow{y}}{\\partial \\overrightarrow{u}}_{n\\times m} \[❌\]∂u ∂J=∂y ∂Jm×1∂u ∂y n×m 可以发现矩阵的行列**无法满足相乘规则,无法相乘** 。 最终通过推导可以得出标量复合函数对向量的求导(分母布局)的正确形式 \[ ✅ \] ∂ J ∂ u → = ∂ y → ∂ u → n × m ∂ J ∂ y → m × 1 \[✅\] \\frac{\\partial J}{\\partial \\overrightarrow{u}}=\\frac{\\partial \\overrightarrow{y}}{\\partial \\overrightarrow{u}}_{n\\times m} \\frac{\\partial J}{\\partial \\overrightarrow{y}}_{m\\times 1} \[✅\]∂u ∂J=∂u ∂y n×m∂y ∂Jm×1 > 例,性能指标、代价函数 状态变量 x → \[ k + 1 \] = A x → \[ k \] + B u → \[ k \] \\overrightarrow{x}_{\[k+1\]}=A\\overrightarrow{x}_{\[k\]}+B\\overrightarrow{u}_{\[k\]} x \[k+1\]=Ax \[k\]+Bu \[k\],代价函数 J = x → \[ k + 1 \] T x → \[ k + 1 \] J=\\overrightarrow{x}\^T_{\[k+1\]}\\overrightarrow{x}_{\[k+1\]} J=x \[k+1\]Tx \[k+1\],则根据上式可得: ∂ J ∂ u → = ∂ x → \[ k + 1 \] ∂ u → \[ k \] ∂ J ∂ x → \[ k + 1 \] \\frac{\\partial J}{\\partial \\overrightarrow{u}}=\\frac{\\partial \\overrightarrow{x}_{\[k+1\]}}{\\partial \\overrightarrow{u}_{\[k\]}} \\frac{\\partial J}{\\partial \\overrightarrow{x}_{\[k+1\]}} ∂u ∂J=∂u \[k\]∂x \[k+1\]∂x \[k+1\]∂J 其中 ∂ x → \[ k + 1 \] ∂ u → \[ k \] = ∂ ( A x → \[ k \] + B u → \[ k \] ) ∂ u → \[ k \] = B T \\frac{\\partial \\overrightarrow{x}_{\[k+1\]}}{\\partial \\overrightarrow{u}_{\[k\]}}=\\frac{\\partial (A\\overrightarrow{x}_{\[k\]}+B\\overrightarrow{u}_{\[k\]})}{\\partial \\overrightarrow{u}_{\[k\]}}=B\^T ∂u \[k\]∂x \[k+1\]=∂u \[k\]∂(Ax \[k\]+Bu \[k\])=BT(向量方程对向量的求导常用特例1), ∂ J ∂ x → \[ k + 1 \] = ∂ ( x → \[ k + 1 \] T x → \[ k + 1 \] ) ∂ x → \[ k + 1 \] = 1 x → \[ k + 1 \] + 1 T x → \[ k + 1 \] = 2 x → \[ k + 1 \] \\frac{\\partial J}{\\partial \\overrightarrow{x}_{\[k+1\]}}=\\frac{\\partial (\\overrightarrow{x}\^T_{\[k+1\]}\\overrightarrow{x}_{\[k+1\]})}{\\partial \\overrightarrow{x}_{\[k+1\]}}=1\\overrightarrow{x}_{\[k+1\]}+1\^T\\overrightarrow{x}_{\[k+1\]}=2\\overrightarrow{x}_{\[k+1\]} ∂x \[k+1\]∂J=∂x \[k+1\]∂(x \[k+1\]Tx \[k+1\])=1x \[k+1\]+1Tx \[k+1\]=2x \[k+1\](向量方程对向量的求导常用特例2),将这两式代入上述最终可得: ∂ J ∂ u → = ∂ x → \[ k + 1 \] ∂ u → \[ k \] ∂ J ∂ x → \[ k + 1 \] = 2 B T x → \[ k + 1 \] \\frac{\\partial J}{\\partial \\overrightarrow{u}}=\\frac{\\partial \\overrightarrow{x}_{\[k+1\]}}{\\partial \\overrightarrow{u}_{\[k\]}} \\frac{\\partial J}{\\partial \\overrightarrow{x}_{\[k+1\]}}=2B\^T\\overrightarrow{x}_{\[k+1\]} ∂u ∂J=∂u \[k\]∂x \[k+1\]∂x \[k+1\]∂J=2BTx \[k+1

相关推荐
爱丽_1 小时前
高维问题如何“降维计算”:矩阵映射、卷积与拆分汇总
深度学习·矩阵·cnn
EQUINOX12 小时前
马尔可夫链
线性代数·动态规划·随机数学
MediaTea3 小时前
NumPy 函数手册:线性代数
线性代数·numpy
放下华子我只抽RuiKe56 小时前
深度学习 - 01 - NLP自然语言处理基础
前端·人工智能·深度学习·神经网络·自然语言处理·矩阵·easyui
AI科技星6 小时前
基于v≡c光速螺旋理论的正确性证明:严格遵循科学方法论的完整路径
c语言·开发语言·人工智能·线性代数·算法·机器学习·数学建模
RFdragon10 小时前
分享本周所学——三维重建算法3D Gaussian Splatting(3DGS)
人工智能·线性代数·算法·机器学习·计算机视觉·矩阵·paddlepaddle
西***634715 小时前
什么是4:4:4超清画质?讯维矩阵在这方面有何技术优势?
矩阵·成都讯维
小白学电子_1 天前
51单片机 proteus仿真 智能锁 (4x4矩阵键盘+数码管+外部中断代码详解)
矩阵·51单片机·proteus
Tisfy1 天前
LeetCode 2946.循环移位后的矩阵相似检查:模拟(左即是右)
算法·leetcode·矩阵·题解
穿条秋裤到处跑1 天前
每日一道leetcode(2026.03.27):循环移位后的矩阵相似检查
算法·leetcode·矩阵