《机器学习数学基础》补充资料:可逆矩阵的手工计算方法和总结

《机器学习数学基础》第2章2.3.1节阐述了可逆矩阵的定义、性质,并演示了Python中的计算函数及其应用。

本文是对书中这部分内容的补充,主要是说明如何用手工计算的方法得到常用矩阵的逆矩阵(如果可逆)。

若一个矩阵存在逆矩阵,则称之为可逆矩阵,或者非奇异矩阵。

并不是所有的矩阵都是可逆矩阵。

以下内容主要参考 [5]。

1. 2 阶逆矩阵公式

设 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 是 2 × 2 2\times2 2×2 可逆矩阵,则其逆矩阵公式:

A − 1 = 1 a d − b c [ d − b − c a ] \pmb{A}^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=ad−bc1[d−c−ba]

1.1 方法1:化简增广矩阵

其推导过程如下:

[ a b 1 0 c d 0 1 ] → [ a b 1 0 0 a d − b c − c a ] → [ a b 1 0 0 1 − c a d − b c a a d − b c ] → [ a 0 a d a d − b c − a b a d − b c 0 1 − c a d − b c a a d − b c ] → [ 1 0 d a d − b c − b a d − b c 0 1 − c a d − b c a a d − b c ] \begin{split}\left[\begin{array}{c c|c c}a&b&1&0\\c&d&0&1\end{array}\right] &\to \left[\begin{array}{c c|c c}a&b&1&0\\0&ad-bc&-c&a\end{array}\right]\\&\to\left[\begin{array}{c c|c c}a&b&1&0\\0&1&\frac{-c}{ad-bc}&\frac{a}{ad-bc}\end{array}\right]\\&\to\left[\begin{array}{c c|c c}a&0&\frac{ad}{ad-bc}&\frac{-ab}{ad-bc}\\0&1&\frac{-c}{ad-bc}&\frac{a}{ad-bc}\end{array}\right]\\&\to\left[\begin{array}{c c|c c}1&0&\frac{d}{ad-bc}&\frac{-b}{ad-bc}\\0&1&\frac{-c}{ad-bc}&\frac{a}{ad-bc}\end{array}\right]\end{split} [acbd1001]→[a0bad−bc1−c0a]→[a0b11ad−bc−c0ad−bca]→[a001ad−bcadad−bc−cad−bc−abad−bca]→[1001ad−bcdad−bc−cad−bc−bad−bca]

故,矩阵 A \pmb{A} A 可逆的充要条件是 ∣ A ∣ = a d − b c ≠ 0 |\pmb{A}|=ad-bc\ne0 ∣A∣=ad−bc=0 。

1.2 方法2:伴随矩阵

设 X = [ x 11 x 12 x 21 x 22 ] \pmb{X}=\begin{bmatrix}x_{11}&x_{12}\\x_{21}&x_{22}\end{bmatrix} X=[x11x21x12x22] 是矩阵 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆矩阵,则 A X = I 2 \pmb{AX}=\pmb{I}_2 AX=I2 ,即:

[ a b c d ] [ x 11 x 12 x 21 x 22 ] = [ 1 0 0 1 ] \begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x_{11}&x_{12}\\x_{21}&x_{22}\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix} [acbd][x11x21x12x22]=[1001]

根据矩阵乘法的含义 [ 1 ] ^{[1]} [1],可得:

[ a b c d ] [ x 11 x 21 ] = [ 1 0 ] , [ a b c d ] [ x 12 x 22 ] = [ 0 1 ] \begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x_{11}\\x_{21}\end{bmatrix}=\begin{bmatrix}1\\0\end{bmatrix},\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x_{12}\\x_{22}\end{bmatrix}=\begin{bmatrix}0\\1\end{bmatrix} [acbd][x11x21]=[10],[acbd][x12x22]=[01]

利用克拉默法则 [ 2 ] ^{[2]} [2] ,可以解得:

x 11 = ∣ 1 b 0 d ∣ ∣ a b c d ∣ = d a d − b c x_{11}=\frac{\begin{vmatrix}1&b\\0&d\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{d}{ad-bc} x11= acbd 10bd =ad−bcd

x 21 = ∣ a 1 c 0 ∣ ∣ a b c d ∣ = − c a d − b c x_{21}=\frac{\begin{vmatrix}a&1\\c&0\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{-c}{ad-bc} x21= acbd ac10 =ad−bc−c

x 12 = ∣ 0 b 1 d ∣ ∣ a b c d ∣ = − b a d − b c x_{12}=\frac{\begin{vmatrix}0&b\\1&d\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{-b}{ad-bc} x12= acbd 01bd =ad−bc−b

x 22 = ∣ a 0 c 1 ∣ ∣ a b c d ∣ = a a d − b c x_{22}=\frac{\begin{vmatrix}a&0\\c&1\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{a}{ad-bc} x22= acbd ac01 =ad−bca

1.3 方法3:凯莱-哈密顿定理

根据凯莱-哈密顿定理,对 n n n 阶方阵,特征多项式为 p ( λ ) = d e t ( A − λ I ) p(\lambda)=det(\pmb{A}-\lambda\pmb{I}) p(λ)=det(A−λI) ( d e t ( ⋅ ) det(\cdot) det(⋅) 表示行列式,与 ∣ ⋅ ∣ |\cdot| ∣⋅∣ 含义一样),有 p ( A ) = 0 p(\pmb{A})=0 p(A)=0 $ [ 3 ] ^{[3]} [3]。

对矩阵 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] ,其特征多项式:

p ( λ ) = ∣ a − λ b c d − λ ∣ = λ 2 − ( a + d ) λ + ( a d − b c ) = λ 2 − T r ( A ) λ + ∣ A ∣ \begin{split}p(\lambda)&=\begin{vmatrix}a-\lambda&b\\c&d-\lambda\end{vmatrix}\\&=\lambda^2-(a+d)\lambda+(ad-bc)\\&=\lambda^2-Tr(\pmb{A})\lambda+|\pmb{A}|\end{split} p(λ)= a−λcbd−λ =λ2−(a+d)λ+(ad−bc)=λ2−Tr(A)λ+∣A∣

根据凯莱-哈密顿定理,有:

p ( A ) = A 2 − T r ( A ) A + ∣ A ∣ I 2 = 0 p(\pmb{A})=\pmb{A}^2-Tr(\pmb{A})\pmb{A}+|\pmb{A}|\pmb{I}_2=0 p(A)=A2−Tr(A)A+∣A∣I2=0

上式乘以 1 ∣ A ∣ A − 1 \frac{1}{|\pmb{A}|}\pmb{A}^{-1} ∣A∣1A−1 ,得:

1 ∣ A ∣ A 2 A − 1 − 1 ∣ A ∣ T r ( A ) A A − 1 + 1 ∣ A ∣ ∣ A ∣ I 2 A − 1 = 0 \frac{1}{|\pmb{A}|}\pmb{A}^2\pmb{A}^{-1}-\frac{1}{|\pmb{A}|}Tr(\pmb{A})\pmb{A}\pmb{A}^{-1}+\frac{1}{|\pmb{A}|}|\pmb{A}|\pmb{I}_2\pmb{A}^{-1}=0 ∣A∣1A2A−1−∣A∣1Tr(A)AA−1+∣A∣1∣A∣I2A−1=0

1 ∣ A ∣ A − 1 ∣ A ∣ T r ( A ) I 2 + I 2 A − 1 = 0 \frac{1}{|\pmb{A}|}\pmb{A}-\frac{1}{|\pmb{A}|}Tr(\pmb{A})\pmb{I}_2+\pmb{I}_2\pmb{A}^{-1}=0 ∣A∣1A−∣A∣1Tr(A)I2+I2A−1=0

因为 I 2 A − 1 = A − 1 \pmb{I}_2\pmb{A}^{-1}=\pmb{A}^{-1} I2A−1=A−1 ,则由上式可得:

A − 1 = 1 ∣ A ∣ ( − A + T r ( A ) I 2 ) = 1 ∣ A ∣ ( − [ a b c d ] + ( a + d ) [ 1 0 0 1 ] ) = 1 ∣ A ∣ [ d − b − c a ] \begin{split}\pmb{A}^{-1}&=\frac{1}{|\pmb{A}|}(-\pmb{A}+Tr(\pmb{A})\pmb{I}_2)\\&=\frac{1}{|\pmb{A}|}\left(-\begin{bmatrix}a&b\\c&d\end{bmatrix}+(a+d)\begin{bmatrix}1&0\\0&1\end{bmatrix}\right)\\&=\frac{1}{|\pmb{A}|}\begin{bmatrix}d&-b\\-c&a\end{bmatrix}\end{split} A−1=∣A∣1(−A+Tr(A)I2)=∣A∣1(−[acbd]+(a+d)[1001])=∣A∣1[d−c−ba]

2. 3 阶逆矩阵公式

2.1 方法1:化简增广矩阵

与前述 2 2 2 阶方法一样。

2.2 方法2:伴随矩阵

设 A = [ a i j ] m × n \pmb{A}=[a_{ij}]{m\times n} A=[aij]m×n 的伴随矩阵(adjugate) a d j A adj\pmb{A} adjA ,各元素为 ( a d j A ) i j = ( − 1 ) i + j d e t A ~ j i (adj\pmb{A}){ij}=(-1)^{i+j}det\widetilde{\pmb{A}}{ji} (adjA)ij=(−1)i+jdetA ji ,其中 A ~ j i \widetilde{\pmb{A}}{ji} A ji 表示移除 A \pmb{A} A 的第 j j j 行与第 i i i 列之后得到的 ( n − 1 ) × ( n − 1 ) (n-1)\times(n-1) (n−1)×(n−1) 子阵, d e t A ~ j i det\widetilde{\pmb{A}}{ji} detA ji 为余子式(minor), ( − 1 ) i + j d e t A ~ j i (-1)^{i+j}det\widetilde{\pmb{A}}{ji} (−1)i+jdetA ji 称为 a j i a_{ji} aji 的余子式。

伴随矩阵的等式 [ 4 ] ^{[4]} [4]:

A ( a d j A ) = ( d e t A ) I n \pmb{A}(adj\pmb{A})=(det\pmb{A})\pmb{I}_n A(adjA)=(detA)In

上式两边乘以 1 ∣ A ∣ A − 1 \frac{1}{|\pmb{A}|}\pmb{A}^{-1} ∣A∣1A−1 ,得:

A − 1 = 1 ∣ A ∣ a d j A \pmb{A}^{-1}=\frac{1}{|\pmb{A}|}adj\pmb{A} A−1=∣A∣1adjA

以 2 × 2 2\times2 2×2 矩阵为例,则可以得到 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆矩阵:

A − 1 = 1 ∣ A ∣ [ A ~ 11 − A ~ 21 − A ~ 12 A ~ 22 ] = 1 ∣ A ∣ [ d − b − c a ] \pmb{A}^{-1}=\frac{1}{|\pmb{A}|}\begin{bmatrix}\widetilde{\pmb{A}}{11}&-\widetilde{\pmb{A}}{21}\\-\widetilde{\pmb{A}}{12}&\widetilde{\pmb{A}}{22}\end{bmatrix}=\frac{1}{|\pmb{A}|}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=∣A∣1[A 11−A 12−A 21A 22]=∣A∣1[d−c−ba]

对于 3 × 3 3\times3 3×3 的矩阵,则为:

A − 1 = [ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ] − 1 = 1 ∣ A ∣ [ ∣ a 22 a 23 a 32 a 33 ∣ − ∣ a 12 a 13 a 32 a 33 ∣ ∣ a 12 a 13 a 22 a 23 ∣ − ∣ a 21 a 23 a 31 a 33 ∣ ∣ a 11 a 13 a 31 a 33 ∣ − ∣ a 11 a 13 a 21 a 23 ∣ ∣ a 21 a 22 a 31 a 32 ∣ − ∣ a 11 a 12 a 31 a 32 ∣ ∣ a 11 a 12 a 21 a 22 ∣ ] \pmb{A}^{-1}=\begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{bmatrix}^{-1}=\frac{1}{|\pmb{A}|}\begin{bmatrix}\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix}-\begin{vmatrix}a_{12}&a_{13}\\a_{32}&a_{33}\end{vmatrix}&\begin{vmatrix}a_{12}&a_{13}\\a_{22}&a_{23}\end{vmatrix}\\-\begin{vmatrix}a_{21}&a_{23}\\a_{31}&a_{33}\end{vmatrix}&\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}-\begin{vmatrix}a_{11}&a_{13}\\a_{21}&a_{23}\end{vmatrix}\\\begin{vmatrix}a_{21}&a_{22}\\a_{31}&a_{32}\end{vmatrix}-\begin{vmatrix}a_{11}&a_{12}\\a_{31}&a_{32}\end{vmatrix}&\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}\end{bmatrix} A−1= a11a21a31a12a22a32a13a23a33 −1=∣A∣1 a22a32a23a33 − a12a32a13a33 − a21a31a23a33 a21a31a22a32 − a11a31a12a32 a12a22a13a23 a11a31a13a33 − a11a21a13a23 a11a21a12a22

方法3:凯莱-哈密顿定理

参照前述 2 2 2 阶矩阵的方法,可以写出 3 3 3 阶矩阵的特征多项式

p ( λ ) = ∣ a 11 − λ a 12 a 13 a 21 a 22 − λ a 23 a 31 a 32 a 33 − λ ∣ = − λ 3 + ( a 11 + a 22 + a 33 ) λ 2 − ( ∣ a 11 a 12 a 21 a 22 ∣ + ∣ a 11 a 13 a 31 a 33 ∣ + ∣ a 22 a 23 a 32 a 33 ∣ ) λ + ∣ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ = − λ 3 + T r ( A ) λ 2 − ( ∣ a 11 a 12 a 21 a 22 ∣ + ∣ a 11 a 13 a 31 a 33 ∣ + ∣ a 22 a 23 a 32 a 33 ∣ ) λ + ∣ A ∣ \begin{split}p(\lambda)&=\begin{vmatrix}a_{11}-\lambda&a_{12}&a_{13}\\a_{21}&a_{22}-\lambda&a_{23}\\a_{31}&a_{32}&a_{33}-\lambda\end{vmatrix}\\&=-\lambda^3+(a_{11}+a_{22}+a_{33})\lambda^2-\left(\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}+\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix}\right)\lambda+\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}\\&=-\lambda^3+Tr(\pmb{A})\lambda^2-\left(\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}+\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix}\right)\lambda+|\pmb{A}|\end{split} p(λ)= a11−λa21a31a12a22−λa32a13a23a33−λ =−λ3+(a11+a22+a33)λ2−( a11a21a12a22 + a11a31a13a33 + a22a32a23a33 )λ+ a11a21a31a12a22a32a13a23a33 =−λ3+Tr(A)λ2−( a11a21a12a22 + a11a31a13a33 + a22a32a23a33 )λ+∣A∣

令 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3 为 A \pmb{A} A 的特征值,因为这些特征值是特征多项式(上式)的跟,所以:

p ( λ ) = − ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = − λ 3 + ( λ 1 + λ 2 + λ 3 ) λ 2 − ( λ 1 λ 2 + λ 1 λ 3 + λ 2 λ 3 ) λ + λ 1 λ 2 λ 3 \begin{split}p(\lambda)&=-(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)\\&=-\lambda^3+(\lambda_1+\lambda_2+\lambda_3)\lambda^2-(\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3)\lambda+\lambda_1\lambda_2\lambda_3\end{split} p(λ)=−(λ−λ1)(λ−λ2)(λ−λ3)=−λ3+(λ1+λ2+λ3)λ2−(λ1λ2+λ1λ3+λ2λ3)λ+λ1λ2λ3

因为 T r ( A ) = λ 1 + λ 2 + λ 3 Tr(\pmb{A})=\lambda_1+\lambda_2+\lambda_3 Tr(A)=λ1+λ2+λ3 , T r ( A 2 ) = λ 1 2 + λ 2 2 + λ 3 2 Tr(\pmb{A}^2)=\lambda_1^2+\lambda_2^2+\lambda_3^2 Tr(A2)=λ12+λ22+λ32 (参阅《机器学习数学基础》第3章3.1.2节矩阵的迹),则:

λ 1 λ 2 + λ 1 λ 3 + λ 2 λ 3 = ( λ 1 + λ 2 + λ 3 ) 2 − ( λ 1 2 + λ 2 2 + λ 3 2 ) 2 = [ T r ( A ) ] 2 − T r ( A 2 ) 2 \lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3=\frac{(\lambda_1+\lambda_2+\lambda_3)^2-(\lambda_1^2+\lambda_2^2+\lambda_3^2)}{2}=\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2} λ1λ2+λ1λ3+λ2λ3=2(λ1+λ2+λ3)2−(λ12+λ22+λ32)=2[Tr(A)]2−Tr(A2)

又因为 ∣ A ∣ = λ 1 λ 2 λ 3 |\pmb{A}|=\lambda_1\lambda_2\lambda_3 ∣A∣=λ1λ2λ3 ,根据凯莱-哈密顿定理:

p ( A ) = − A 3 + T r ( A ) A 2 − [ T r ( A ) ] 2 − T r ( A 2 ) 2 A + ∣ A ∣ I 3 = 0 p(\pmb{A})=-\pmb{A}^3+Tr(\pmb{A})\pmb{A}^2-\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2}\pmb{A}+|\pmb{A}|\pmb{I}_3=0 p(A)=−A3+Tr(A)A2−2[Tr(A)]2−Tr(A2)A+∣A∣I3=0

上式乘以 1 ∣ A ∣ A − 1 \frac{1}{|\pmb{A}|}\pmb{A}^{-1} ∣A∣1A−1 ,得到 3 × 3 3\times3 3×3 矩阵的逆矩阵的矩阵多项式:

A − 1 = 1 ∣ A ∣ ( A 2 − T r ( A ) A + [ T r ( A ) ] 2 − T r ( A 2 ) 2 I 3 ) \pmb{A}^{-1}=\frac{1}{|\pmb{A}|}\left(\pmb{A}^2-Tr(\pmb{A})\pmb{A}+\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2}\pmb{I}_3\right) A−1=∣A∣1(A2−Tr(A)A+2[Tr(A)]2−Tr(A2)I3)

同时,可以计算 A \pmb{A} A 的伴随矩阵:

a d j A = A 2 − T r ( A ) + [ T r ( A ) ] 2 − T r ( A 2 ) 2 I 3 adj\pmb{A}=\pmb{A}^2-Tr(\pmb{A})+\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2}\pmb{I}_3 adjA=A2−Tr(A)+2[Tr(A)]2−Tr(A2)I3

3. 可逆矩阵定理和性质总结

3.1 定理

令 A \pmb{A} A 是一个 n × n n\times n n×n 的实矩阵,则以下表述对于可逆矩阵 A \pmb{A} A 是等价的:

  1. A \pmb{A} A 是可逆的,或者说存在 A − 1 \pmb{A}^{-1} A−1 满足 A − 1 A = I n \pmb{A}^{-1}\pmb{A}=\pmb{I}_n A−1A=In , I n \pmb{I}_n In 是 n n n 阶单位矩阵。

  2. A x = 0 \pmb{Ax}=\pmb{0} Ax=0 仅有平凡解 x = 0 \pmb{x}=\pmb{0} x=0 。

    证明

    若 A \pmb{A} A 可逆,对于 A x = 0 \pmb{Ax} = \pmb{0} Ax=0 两侧左乘 A − 1 \pmb{A}^{-1} A−1 。左侧得: A − 1 A x = I x = x \pmb{A}^{-1}\pmb{Ax}=\pmb{Ix}=\pmb{x} A−1Ax=Ix=x ;右侧为: A − 1 0 = 0 \pmb{A}^{-1}\pmb{0}=\pmb{0} A−10=0 。故 x = 0 \pmb{x}=\pmb0 x=0 。

  3. A x = b \pmb{Ax}=\pmb{b} Ax=b 有唯一解 x = A − 1 b \pmb{x}=\pmb{A}^{-1}\pmb{b} x=A−1b 。

    证明

    假设此方程有两个相异的解 u \pmb{u} u 和 v \pmb{v} v ,由已知方程式,可知:

    A ( u − v ) = A u − A v = b − b = 0 \pmb{A}(\pmb{u}-\pmb{v})=\pmb{Au}-\pmb{Av}=\pmb{b}-\pmb{b}=\pmb{0} A(u−v)=Au−Av=b−b=0

    即非平凡解满足 A x = 0 \pmb{Ax}=\pmb{0} Ax=0 。故 A x = b \pmb{Ax}=\pmb{b} Ax=b 有唯一解。

  4. A \pmb{A} A​ 有 n n n​ 个非零主元(pivot)。

  5. A \pmb{A} A 的简约行梯形式(reduced row echelon form)为 I n \pmb{I}_n In ,或者说 A \pmb{A} A 行等价于 I n \pmb{I}_n In 。

    证明

    由第3条唯一解知,增广矩阵 [ A b ] \begin{bmatrix}\pmb{A}&\pmb{b}\end{bmatrix} [Ab] 可化简为 [ I A − 1 b ] \begin{bmatrix}\pmb{I}&\pmb{A}^{-1}\pmb{b}\end{bmatrix} [IA−1b] ,即:

    A − 1 [ A b ] = [ A − 1 A A − 1 b ] = [ I A − 1 b ] \pmb{A}^{-1}\begin{bmatrix}\pmb{A}&\pmb{b}\end{bmatrix}=\begin{bmatrix}\pmb{A}^{-1}\pmb{A}&\pmb{A}^{-1}\pmb{b}\end{bmatrix}=\begin{bmatrix}\pmb{I}&\pmb{A}^{-1}\pmb{b}\end{bmatrix} A−1[Ab]=[A−1AA−1b]=[IA−1b]

  6. A \pmb{A} A 有线性无关的列向量 (column vector)。

    证明

    设 [ a 1 ⋯ a n ] \begin{bmatrix}\pmb{a}_1&\cdots&\pmb{a}_n\end{bmatrix} [a1⋯an] 为 A \pmb{A} A 的列向量,则:

    [ a 1 ⋯ a n ] [ x 1 ⋮ x n ] = x 1 a 1 + ⋯ + x n a n = 0 \begin{bmatrix}\pmb{a}_1&\cdots&\pmb{a}_n\end{bmatrix}\begin{bmatrix}x_1\\\vdots\\x_n\end{bmatrix}=x_1\pmb{a}_1+\cdots+x_n\pmb{a}_n=\pmb{0} [a1⋯an] x1⋮xn =x1a1+⋯+xnan=0

    如果满足第2条定理,则 [ a 1 ⋯ a n ] \begin{bmatrix}\pmb{a}_1&\cdots&\pmb{a}_n\end{bmatrix} [a1⋯an] 各列向量线性无关。

  7. A \pmb{A} A 有线性无关的行向量 (row vector)。

    证明

    假设 A \pmb{A} A 的行向量线性相关,其中必定存在至少一行可表示其他行的線性組合,也就是说对 A \pmb{A} A 进行高斯消元法将会至少有一个零行,于是总的轴数就小于 n n n 。这与第4条定理矛盾。假设不成立。

  8. r a n k A = n {\rm{rank}}\pmb{A}=n rankA=n​ 。

  9. A \pmb{A} A 的列空間 (column space) 为 R n \mathbb R^n Rn 或者说线性变换 A : R n → R n \pmb{A}:\mathbb{R}^n\to\mathbb{R}^n A:Rn→Rn 是满射(onto,surjective)。

  10. A \pmb{A} A 的行空間 (row space) 为 R n \mathbb{R}^n Rn 。

  11. A \pmb{A} A 的零空間 (nullspace) 为 { 0 } \{\pmb{0}\} {0} ,或者说线性变换 A : R n → R n \pmb{A}:\mathbb{R}^n\to\mathbb{R}^n A:Rn→Rn 是一对一(one-to-one,injective)。

  12. A T \pmb{A}^{\rm{T}} AT 的零空間为 { 0 } \{\pmb{0}\} {0} 。

  13. det ⁡ A ≠ 0 \det\pmb{A}\ne0 detA=0​ 。

  14. A \pmb{A} A 的特征值不为零。

  15. A T A \pmb{A}^{\rm{T}}\pmb{A} ATA 是实对称正定矩阵。

  16. A \pmb{A} A 的奇异值(sigular value)大于零。

参考文献

[1]. 对矩阵乘法的深入理解

[2]. 克拉默法则

[3]. https://zh.wikipedia.org/wiki/凱萊--哈密頓定理

[4]. https://zh.wikipedia.org/wiki/伴随矩阵

[5]. https://ccjou.wordpress.com/2012/10/04/三階逆矩陣公式/

相关推荐
车载诊断技术1 小时前
人工智能AI在汽车设计领域的应用探索
数据库·人工智能·网络协议·架构·汽车·是诊断功能配置的核心
AuGuSt_812 小时前
【深度学习】Hopfield网络:模拟联想记忆
人工智能·深度学习
jndingxin2 小时前
OpenCV计算摄影学(6)高动态范围成像(HDR imaging)
人工智能·opencv·计算机视觉
Sol-itude2 小时前
【文献阅读】Collective Decision for Open Set Recognition
论文阅读·人工智能·机器学习·支持向量机
没事偷着乐琅3 小时前
人工智能 pytorch篇
人工智能·pytorch·python
邪恶的贝利亚3 小时前
Pytorch常用函数
人工智能·pytorch·python
Ironben3 小时前
看好 MCP,但用不了 Claude,所以做了一款 MCP 客户端
人工智能·claude·mcp
佛州小李哥3 小时前
构建逻辑思维链(CoT)为金融AI消除幻觉(保险赔付篇)
人工智能·科技·ai·金融·云计算·aws·亚马逊云科技
xilu04 小时前
MCP与RAG:增强大型语言模型的两种路径
人工智能·llm·mcp
阿正的梦工坊4 小时前
PyTorch 中的 nn.ModuleList 是什么?与普通列表有啥区别?
人工智能·pytorch·python