矩阵迹(Trace)的性质及简单推导

1. 基础定义

迹(Trace) 是一个矩阵的对角线元素之和。对于矩阵 A A A,其迹定义为:

Trace ( A ) = ∑ i A i i \text{Trace}(A) = \sum_{i} A_{ii} Trace(A)=i∑Aii

迹的一个重要性质是:

Trace ( A B ) = Trace ( B A ) \text{Trace}(A B) = \text{Trace}(B A) Trace(AB)=Trace(BA)

即两个矩阵相乘后的迹不依赖于它们的顺序。

2. 迹对矩阵的导数

考虑矩阵 X X X,我们推导一些常见的迹函数的导数公式。

2.1 对 Trace ( A X ) \text{Trace}(A X) Trace(AX) 求导

假设 A A A 是已知矩阵, X X X 是需要对其求导的矩阵。我们计算 ∂ ∂ X Trace ( A X ) \frac{\partial}{\partial X} \text{Trace}(A X) ∂X∂Trace(AX):

Trace ( A X ) = ∑ i , j A i j X j i \text{Trace}(A X) = \sum_{i,j} A_{ij} X_{ji} Trace(AX)=i,j∑AijXji

对 X X X 求导:

∂ ∂ X k l Trace ( A X ) = A l k \frac{\partial}{\partial X_{kl}} \text{Trace}(A X) = A_{lk} ∂Xkl∂Trace(AX)=Alk

将其转换为矩阵形式:

∂ ∂ X Trace ( A X ) = A T \frac{\partial}{\partial X} \text{Trace}(A X) = A^T ∂X∂Trace(AX)=AT

2.2 对 Trace ( X T A X ) \text{Trace}(X^T A X) Trace(XTAX) 求导

考虑更复杂的形式 Trace ( X T A X ) \text{Trace}(X^T A X) Trace(XTAX),其中 A A A 是已知矩阵, X X X 是需要对其求导的矩阵。

展开迹:

Trace ( X T A X ) = ∑ i , j , k X k i A i j X k j \text{Trace}(X^T A X) = \sum_{i,j,k} X_{ki} A_{ij} X_{kj} Trace(XTAX)=i,j,k∑XkiAijXkj

对 X p q X_{pq} Xpq 求导:

∂ ∂ X p q ∑ i , j , k X k i A i j X k j = A q q X p q + X p q A q q T \frac{\partial}{\partial X_{pq}} \sum_{i,j,k} X_{ki} A_{ij} X_{kj} = A_{qq} X_{pq} + X_{pq} A_{qq}^T ∂Xpq∂i,j,k∑XkiAijXkj=AqqXpq+XpqAqqT

综合所有项后,得到:

∂ ∂ X Trace ( X T A X ) = A X + X A T \frac{\partial}{\partial X} \text{Trace}(X^T A X) = A X + X A^T ∂X∂Trace(XTAX)=AX+XAT

2.3 总结迹的导数性质

  1. ∂ ∂ X Trace ( A X ) = A T \frac{\partial}{\partial X} \text{Trace}(A X) = A^T ∂X∂Trace(AX)=AT

    • 迹函数可以通过矩阵元素的线性组合进行转换,导数为 A A A 的转置。
  2. ∂ ∂ X Trace ( X T A X ) = A X + X A T \frac{\partial}{\partial X} \text{Trace}(X^T A X) = A X + X A^T ∂X∂Trace(XTAX)=AX+XAT

    • 二次型矩阵的迹求导需要分别对矩阵 X X X 的左右项进行求导,并合并结果。

备注

个人水平有限,有问题随时交流~

相关推荐
MediaTea3 小时前
AI 术语通俗词典:矩阵乘法
人工智能·线性代数·矩阵
AI_零食10 小时前
开源鸿蒙跨平台Flutter开发:研究生科研贡献雷达矩阵架构
学习·flutter·ui·华为·矩阵·开源·harmonyos
如竟没有火炬11 小时前
搜索二维矩阵
数据结构·python·算法·leetcode·矩阵
6Hzlia12 小时前
【Hot 100 刷题计划】 LeetCode 54. 螺旋矩阵 | C++ 模拟法题解
c++·leetcode·矩阵
AI_零食12 小时前
开源鸿蒙跨平台Flutter开发:生物力学与力量周期-臂力训练矩阵架构
学习·flutter·ui·华为·矩阵·开源·harmonyos
AI科技星13 小时前
基于三维空间合速度恒为光速公理的统一动力学与热力学理论:温度本质的第一性原理诠释与物质全物态实验验证
开发语言·线性代数·机器学习·计算机视觉·数学建模
py有趣13 小时前
力扣热门100题之矩阵置零
算法·leetcode·矩阵
多年小白1 天前
AI 日报 - 2026年4月6日
网络·人工智能·科技·矩阵
笨笨饿2 天前
30_泰勒级数
c语言·stm32·嵌入式硬件·线性代数·机器学习·自动化·概率论
计算机安禾2 天前
【数据结构与算法】第28篇:平衡二叉树(AVL树)
开发语言·数据结构·数据库·线性代数·算法·矩阵·visual studio