矩阵的导数运算1——标量向量方程对向量的求导

1. 标量方程对向量的求导

对向量求导前需要明确使用哪种布局形式,主要分为分母布局和分子布局。

1.1 分母布局

定义y→=y1..ymm×1\overrightarrow{y}= \begin{bmatrix} y_1\\ .\\ .\\ y_m\\ \end{bmatrix}{m\times1}y = y1..ym m×1,f(y→)f(\overrightarrow{y})f(y )为标量,则:
∂f(y→)∂y→=∂f(y→)∂y1..∂f(y→)∂ymm×1\frac{\partial f(\overrightarrow{y})}{\partial \overrightarrow{y}}= \begin{bmatrix} \frac{\partial f(\overrightarrow{y})}{\partial y_1}\\ .\\ .\\ \frac{\partial f(\overrightarrow{y})}{\partial y_m} \end{bmatrix}
{m\times1}∂y ∂f(y )= ∂y1∂f(y )..∂ym∂f(y ) m×1

可以发现求导的结果也是一个向量,且该向量的行数与分母的行数相同(都为m),这种布局称为分母布局

1.2 分子布局

定义y→=y1..ym1×n\overrightarrow{y}= \begin{bmatrix} y_1&.&.&y_m \end{bmatrix}_{1\times n}y =y1..ym1×n,f(y→)f(\overrightarrow{y})f(y )为标量,则

∂f(y→)∂y→=∂f(y→)∂y1..∂f(y→)∂ym1×n\frac{\partial f(\overrightarrow{y})}{\partial \overrightarrow{y}}= \begin{bmatrix} \frac{\partial f(\overrightarrow{y})}{\partial y_1}&.&.&\frac{\partial f(\overrightarrow{y})}{\partial y_m} \end{bmatrix}_{1\times n}∂y ∂f(y )=∂y1∂f(y )..∂ym∂f(y )1×n

可以发现求导的结果也是一个向量,且该向量的行数与分子的行数相同(都为1),这种布局称为分子布局

2. 向量方程对向量的求导

2.1 定义

以下所有推导都采用分母布局。

定义y→=y1..ymm×1\overrightarrow{y}= \begin{bmatrix} y_1\\ .\\ .\\ y_m\\ \end{bmatrix}{m\times1}y = y1..ym m×1,f(y→)=f1(y→)..fn(y→)n×1f(\overrightarrow{y})= \begin{bmatrix} f_1(\overrightarrow{y})\\ .\\ .\\ f_n(\overrightarrow{y})\\ \end{bmatrix}{n\times1}f(y )= f1(y )..fn(y ) n×1也为向量,则

因为是采用分母布局,所以要严格保证求导后的向量的行数要跟分母相同(都为m),因此在对向量f(y→)f(\overrightarrow{y})f(y )进行展开时展开成行的形式。

举个例子,假设y→=y1y2y33×1\overrightarrow{y}= \begin{bmatrix} y_1\\ y_2\\ y_3\\ \end{bmatrix}{3\times1}y = y1y2y3 3×1,f(y→)=y12+y22y22+2y32×1f(\overrightarrow{y})= \begin{bmatrix} y_1^2+y_2^2\\ y_2^2+2y_3\\ \end{bmatrix}{2\times1}f(y )=y12+y22y22+2y32×1,则

2.2 两个常用的特例

1️⃣

若y→=y1..ymm×1\overrightarrow{y}= \begin{bmatrix} y_1\\ .\\ .\\ y_m\\ \end{bmatrix}{m\times1}y = y1..ym m×1,A=a11..a1m......a1m..ammm×mA= \begin{bmatrix} a{11}&.&.&a_{1m}\\ .&.&&.\\ .&&.&.\\ a_{1m}&.&.&a_{mm} \end{bmatrix}_{m\times m}A= a11..a1m......a1m..amm m×m,则有
∂Ay→∂y→=AT\frac{\partial A\overrightarrow{y}}{\partial \overrightarrow{y}} = A^T∂y ∂Ay =AT

2️⃣

若y→=y1..ymm×1\overrightarrow{y}= \begin{bmatrix} y_1\\ .\\ .\\ y_m\\ \end{bmatrix}{m\times1}y = y1..ym m×1,,,A=a11..a1m......a1m..ammm×mA= \begin{bmatrix} a{11}&.&.&a_{1m}\\ .&.&&.\\ .&&.&.\\ a_{1m}&.&.&a_{mm} \end{bmatrix}_{m\times m}A= a11..a1m......a1m..amm m×m,则有
∂y→TAy→∂y→=Ay→+ATy→\frac{\partial \overrightarrow{y}^TA\overrightarrow{y}}{\partial \overrightarrow{y}} = A\overrightarrow{y}+A^T\overrightarrow{y} ∂y ∂y TAy =Ay +ATy (重要)

相关推荐
Bobolink_13 天前
TikTok矩阵账号如何批量养号?工作室级运营方案分享
矩阵·内容运营·跨境电商·tik tok·账号运营
H1785350909613 天前
SolidWorks第四部分_直接实体建模特征9_替换面原理
线性代数·算法·机器学习·3d建模·solidworks
AI_yangxi13 天前
短视频矩阵系统专业公司
大数据·人工智能·矩阵
昇腾CANN13 天前
【cann-samples系列】GroupedMatmul MX量化矩阵乘的深度性能优化实践
线性代数·性能优化·矩阵·昇腾·cann
青山木13 天前
Hot 100 --- 矩阵置零
线性代数·算法·leetcode·矩阵·哈希算法
Jasmine_llq13 天前
《B4264 [GESP202503 四级] 二阶矩阵》
线性代数·算法·矩阵·二维矩阵遍历枚举所有2×2矩阵·交叉乘积等式条件判断·输入输出快读加速·长整型防溢出计数统计
阿泽·黑核14 天前
05 keyflow 扩展设计方案:矩阵键盘/组合键/事件队列/中断驱动
线性代数·矩阵·计算机外设·嵌入式·agent·vibe coding
工头阿乐14 天前
相机坐标系标定与外参矩阵求解
数码相机·线性代数·矩阵
金色熊族15 天前
QTransform使用心得(二)--仿射变换、非仿射变换、矩阵
qt·线性代数·矩阵