《机器学习数学基础》第2章2.3.1节阐述了可逆矩阵的定义、性质,并演示了Python中的计算函数及其应用。
本文是对书中这部分内容的补充,主要是说明如何用手工计算的方法得到常用矩阵的逆矩阵(如果可逆)。
若一个矩阵存在逆矩阵,则称之为可逆矩阵,或者非奇异矩阵。
并不是所有的矩阵都是可逆矩阵。
以下内容主要参考 [5]。
1. 2 阶逆矩阵公式
设 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 是 2 × 2 2\times2 2×2 可逆矩阵,则其逆矩阵公式:
A − 1 = 1 a d − b c [ d − b − c a ] \pmb{A}^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=ad−bc1[d−c−ba]
1.1 方法1:化简增广矩阵
其推导过程如下:
[ a b 1 0 c d 0 1 ] → [ a b 1 0 0 a d − b c − c a ] → [ a b 1 0 0 1 − c a d − b c a a d − b c ] → [ a 0 a d a d − b c − a b a d − b c 0 1 − c a d − b c a a d − b c ] → [ 1 0 d a d − b c − b a d − b c 0 1 − c a d − b c a a d − b c ] \begin{split}\left[\begin{array}{c c|c c}a&b&1&0\\c&d&0&1\end{array}\right] &\to \left[\begin{array}{c c|c c}a&b&1&0\\0&ad-bc&-c&a\end{array}\right]\\&\to\left[\begin{array}{c c|c c}a&b&1&0\\0&1&\frac{-c}{ad-bc}&\frac{a}{ad-bc}\end{array}\right]\\&\to\left[\begin{array}{c c|c c}a&0&\frac{ad}{ad-bc}&\frac{-ab}{ad-bc}\\0&1&\frac{-c}{ad-bc}&\frac{a}{ad-bc}\end{array}\right]\\&\to\left[\begin{array}{c c|c c}1&0&\frac{d}{ad-bc}&\frac{-b}{ad-bc}\\0&1&\frac{-c}{ad-bc}&\frac{a}{ad-bc}\end{array}\right]\end{split} [acbd1001]→[a0bad−bc1−c0a]→[a0b11ad−bc−c0ad−bca]→[a001ad−bcadad−bc−cad−bc−abad−bca]→[1001ad−bcdad−bc−cad−bc−bad−bca]
故,矩阵 A \pmb{A} A 可逆的充要条件是 ∣ A ∣ = a d − b c ≠ 0 |\pmb{A}|=ad-bc\ne0 ∣A∣=ad−bc=0 。
1.2 方法2:伴随矩阵
设 X = [ x 11 x 12 x 21 x 22 ] \pmb{X}=\begin{bmatrix}x_{11}&x_{12}\\x_{21}&x_{22}\end{bmatrix} X=[x11x21x12x22] 是矩阵 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆矩阵,则 A X = I 2 \pmb{AX}=\pmb{I}_2 AX=I2 ,即:
[ a b c d ] [ x 11 x 12 x 21 x 22 ] = [ 1 0 0 1 ] \begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x_{11}&x_{12}\\x_{21}&x_{22}\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix} [acbd][x11x21x12x22]=[1001]
根据矩阵乘法的含义 [ 1 ] ^{[1]} [1],可得:
[ a b c d ] [ x 11 x 21 ] = [ 1 0 ] , [ a b c d ] [ x 12 x 22 ] = [ 0 1 ] \begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x_{11}\\x_{21}\end{bmatrix}=\begin{bmatrix}1\\0\end{bmatrix},\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x_{12}\\x_{22}\end{bmatrix}=\begin{bmatrix}0\\1\end{bmatrix} [acbd][x11x21]=[10],[acbd][x12x22]=[01]
利用克拉默法则 [ 2 ] ^{[2]} [2] ,可以解得:
x 11 = ∣ 1 b 0 d ∣ ∣ a b c d ∣ = d a d − b c x_{11}=\frac{\begin{vmatrix}1&b\\0&d\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{d}{ad-bc} x11= acbd 10bd =ad−bcd
x 21 = ∣ a 1 c 0 ∣ ∣ a b c d ∣ = − c a d − b c x_{21}=\frac{\begin{vmatrix}a&1\\c&0\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{-c}{ad-bc} x21= acbd ac10 =ad−bc−c
x 12 = ∣ 0 b 1 d ∣ ∣ a b c d ∣ = − b a d − b c x_{12}=\frac{\begin{vmatrix}0&b\\1&d\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{-b}{ad-bc} x12= acbd 01bd =ad−bc−b
x 22 = ∣ a 0 c 1 ∣ ∣ a b c d ∣ = a a d − b c x_{22}=\frac{\begin{vmatrix}a&0\\c&1\end{vmatrix}}{\begin{vmatrix}a&b\\c&d\end{vmatrix}}=\frac{a}{ad-bc} x22= acbd ac01 =ad−bca
1.3 方法3:凯莱-哈密顿定理
根据凯莱-哈密顿定理,对 n n n 阶方阵,特征多项式为 p ( λ ) = d e t ( A − λ I ) p(\lambda)=det(\pmb{A}-\lambda\pmb{I}) p(λ)=det(A−λI) ( d e t ( ⋅ ) det(\cdot) det(⋅) 表示行列式,与 ∣ ⋅ ∣ |\cdot| ∣⋅∣ 含义一样),有 p ( A ) = 0 p(\pmb{A})=0 p(A)=0 $ [ 3 ] ^{[3]} [3]。
对矩阵 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] ,其特征多项式:
p ( λ ) = ∣ a − λ b c d − λ ∣ = λ 2 − ( a + d ) λ + ( a d − b c ) = λ 2 − T r ( A ) λ + ∣ A ∣ \begin{split}p(\lambda)&=\begin{vmatrix}a-\lambda&b\\c&d-\lambda\end{vmatrix}\\&=\lambda^2-(a+d)\lambda+(ad-bc)\\&=\lambda^2-Tr(\pmb{A})\lambda+|\pmb{A}|\end{split} p(λ)= a−λcbd−λ =λ2−(a+d)λ+(ad−bc)=λ2−Tr(A)λ+∣A∣
根据凯莱-哈密顿定理,有:
p ( A ) = A 2 − T r ( A ) A + ∣ A ∣ I 2 = 0 p(\pmb{A})=\pmb{A}^2-Tr(\pmb{A})\pmb{A}+|\pmb{A}|\pmb{I}_2=0 p(A)=A2−Tr(A)A+∣A∣I2=0
上式乘以 1 ∣ A ∣ A − 1 \frac{1}{|\pmb{A}|}\pmb{A}^{-1} ∣A∣1A−1 ,得:
1 ∣ A ∣ A 2 A − 1 − 1 ∣ A ∣ T r ( A ) A A − 1 + 1 ∣ A ∣ ∣ A ∣ I 2 A − 1 = 0 \frac{1}{|\pmb{A}|}\pmb{A}^2\pmb{A}^{-1}-\frac{1}{|\pmb{A}|}Tr(\pmb{A})\pmb{A}\pmb{A}^{-1}+\frac{1}{|\pmb{A}|}|\pmb{A}|\pmb{I}_2\pmb{A}^{-1}=0 ∣A∣1A2A−1−∣A∣1Tr(A)AA−1+∣A∣1∣A∣I2A−1=0
1 ∣ A ∣ A − 1 ∣ A ∣ T r ( A ) I 2 + I 2 A − 1 = 0 \frac{1}{|\pmb{A}|}\pmb{A}-\frac{1}{|\pmb{A}|}Tr(\pmb{A})\pmb{I}_2+\pmb{I}_2\pmb{A}^{-1}=0 ∣A∣1A−∣A∣1Tr(A)I2+I2A−1=0
因为 I 2 A − 1 = A − 1 \pmb{I}_2\pmb{A}^{-1}=\pmb{A}^{-1} I2A−1=A−1 ,则由上式可得:
A − 1 = 1 ∣ A ∣ ( − A + T r ( A ) I 2 ) = 1 ∣ A ∣ ( − [ a b c d ] + ( a + d ) [ 1 0 0 1 ] ) = 1 ∣ A ∣ [ d − b − c a ] \begin{split}\pmb{A}^{-1}&=\frac{1}{|\pmb{A}|}(-\pmb{A}+Tr(\pmb{A})\pmb{I}_2)\\&=\frac{1}{|\pmb{A}|}\left(-\begin{bmatrix}a&b\\c&d\end{bmatrix}+(a+d)\begin{bmatrix}1&0\\0&1\end{bmatrix}\right)\\&=\frac{1}{|\pmb{A}|}\begin{bmatrix}d&-b\\-c&a\end{bmatrix}\end{split} A−1=∣A∣1(−A+Tr(A)I2)=∣A∣1(−[acbd]+(a+d)[1001])=∣A∣1[d−c−ba]
2. 3 阶逆矩阵公式
2.1 方法1:化简增广矩阵
与前述 2 2 2 阶方法一样。
2.2 方法2:伴随矩阵
设 A = [ a i j ] m × n \pmb{A}=[a_{ij}]{m\times n} A=[aij]m×n 的伴随矩阵(adjugate) a d j A adj\pmb{A} adjA ,各元素为 ( a d j A ) i j = ( − 1 ) i + j d e t A ~ j i (adj\pmb{A}){ij}=(-1)^{i+j}det\widetilde{\pmb{A}}{ji} (adjA)ij=(−1)i+jdetA ji ,其中 A ~ j i \widetilde{\pmb{A}}{ji} A ji 表示移除 A \pmb{A} A 的第 j j j 行与第 i i i 列之后得到的 ( n − 1 ) × ( n − 1 ) (n-1)\times(n-1) (n−1)×(n−1) 子阵, d e t A ~ j i det\widetilde{\pmb{A}}{ji} detA ji 为余子式(minor), ( − 1 ) i + j d e t A ~ j i (-1)^{i+j}det\widetilde{\pmb{A}}{ji} (−1)i+jdetA ji 称为 a j i a_{ji} aji 的余子式。
伴随矩阵的等式 [ 4 ] ^{[4]} [4]:
A ( a d j A ) = ( d e t A ) I n \pmb{A}(adj\pmb{A})=(det\pmb{A})\pmb{I}_n A(adjA)=(detA)In
上式两边乘以 1 ∣ A ∣ A − 1 \frac{1}{|\pmb{A}|}\pmb{A}^{-1} ∣A∣1A−1 ,得:
A − 1 = 1 ∣ A ∣ a d j A \pmb{A}^{-1}=\frac{1}{|\pmb{A}|}adj\pmb{A} A−1=∣A∣1adjA
以 2 × 2 2\times2 2×2 矩阵为例,则可以得到 A = [ a b c d ] \pmb{A}=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆矩阵:
A − 1 = 1 ∣ A ∣ [ A ~ 11 − A ~ 21 − A ~ 12 A ~ 22 ] = 1 ∣ A ∣ [ d − b − c a ] \pmb{A}^{-1}=\frac{1}{|\pmb{A}|}\begin{bmatrix}\widetilde{\pmb{A}}{11}&-\widetilde{\pmb{A}}{21}\\-\widetilde{\pmb{A}}{12}&\widetilde{\pmb{A}}{22}\end{bmatrix}=\frac{1}{|\pmb{A}|}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=∣A∣1[A 11−A 12−A 21A 22]=∣A∣1[d−c−ba]
对于 3 × 3 3\times3 3×3 的矩阵,则为:
A − 1 = [ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ] − 1 = 1 ∣ A ∣ [ ∣ a 22 a 23 a 32 a 33 ∣ − ∣ a 12 a 13 a 32 a 33 ∣ ∣ a 12 a 13 a 22 a 23 ∣ − ∣ a 21 a 23 a 31 a 33 ∣ ∣ a 11 a 13 a 31 a 33 ∣ − ∣ a 11 a 13 a 21 a 23 ∣ ∣ a 21 a 22 a 31 a 32 ∣ − ∣ a 11 a 12 a 31 a 32 ∣ ∣ a 11 a 12 a 21 a 22 ∣ ] \pmb{A}^{-1}=\begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{bmatrix}^{-1}=\frac{1}{|\pmb{A}|}\begin{bmatrix}\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix}-\begin{vmatrix}a_{12}&a_{13}\\a_{32}&a_{33}\end{vmatrix}&\begin{vmatrix}a_{12}&a_{13}\\a_{22}&a_{23}\end{vmatrix}\\-\begin{vmatrix}a_{21}&a_{23}\\a_{31}&a_{33}\end{vmatrix}&\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}-\begin{vmatrix}a_{11}&a_{13}\\a_{21}&a_{23}\end{vmatrix}\\\begin{vmatrix}a_{21}&a_{22}\\a_{31}&a_{32}\end{vmatrix}-\begin{vmatrix}a_{11}&a_{12}\\a_{31}&a_{32}\end{vmatrix}&\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}\end{bmatrix} A−1= a11a21a31a12a22a32a13a23a33 −1=∣A∣1 a22a32a23a33 − a12a32a13a33 − a21a31a23a33 a21a31a22a32 − a11a31a12a32 a12a22a13a23 a11a31a13a33 − a11a21a13a23 a11a21a12a22
方法3:凯莱-哈密顿定理
参照前述 2 2 2 阶矩阵的方法,可以写出 3 3 3 阶矩阵的特征多项式
p ( λ ) = ∣ a 11 − λ a 12 a 13 a 21 a 22 − λ a 23 a 31 a 32 a 33 − λ ∣ = − λ 3 + ( a 11 + a 22 + a 33 ) λ 2 − ( ∣ a 11 a 12 a 21 a 22 ∣ + ∣ a 11 a 13 a 31 a 33 ∣ + ∣ a 22 a 23 a 32 a 33 ∣ ) λ + ∣ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ = − λ 3 + T r ( A ) λ 2 − ( ∣ a 11 a 12 a 21 a 22 ∣ + ∣ a 11 a 13 a 31 a 33 ∣ + ∣ a 22 a 23 a 32 a 33 ∣ ) λ + ∣ A ∣ \begin{split}p(\lambda)&=\begin{vmatrix}a_{11}-\lambda&a_{12}&a_{13}\\a_{21}&a_{22}-\lambda&a_{23}\\a_{31}&a_{32}&a_{33}-\lambda\end{vmatrix}\\&=-\lambda^3+(a_{11}+a_{22}+a_{33})\lambda^2-\left(\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}+\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix}\right)\lambda+\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}\\&=-\lambda^3+Tr(\pmb{A})\lambda^2-\left(\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{13}\\a_{31}&a_{33}\end{vmatrix}+\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix}\right)\lambda+|\pmb{A}|\end{split} p(λ)= a11−λa21a31a12a22−λa32a13a23a33−λ =−λ3+(a11+a22+a33)λ2−( a11a21a12a22 + a11a31a13a33 + a22a32a23a33 )λ+ a11a21a31a12a22a32a13a23a33 =−λ3+Tr(A)λ2−( a11a21a12a22 + a11a31a13a33 + a22a32a23a33 )λ+∣A∣
令 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3 为 A \pmb{A} A 的特征值,因为这些特征值是特征多项式(上式)的跟,所以:
p ( λ ) = − ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = − λ 3 + ( λ 1 + λ 2 + λ 3 ) λ 2 − ( λ 1 λ 2 + λ 1 λ 3 + λ 2 λ 3 ) λ + λ 1 λ 2 λ 3 \begin{split}p(\lambda)&=-(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)\\&=-\lambda^3+(\lambda_1+\lambda_2+\lambda_3)\lambda^2-(\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3)\lambda+\lambda_1\lambda_2\lambda_3\end{split} p(λ)=−(λ−λ1)(λ−λ2)(λ−λ3)=−λ3+(λ1+λ2+λ3)λ2−(λ1λ2+λ1λ3+λ2λ3)λ+λ1λ2λ3
因为 T r ( A ) = λ 1 + λ 2 + λ 3 Tr(\pmb{A})=\lambda_1+\lambda_2+\lambda_3 Tr(A)=λ1+λ2+λ3 , T r ( A 2 ) = λ 1 2 + λ 2 2 + λ 3 2 Tr(\pmb{A}^2)=\lambda_1^2+\lambda_2^2+\lambda_3^2 Tr(A2)=λ12+λ22+λ32 (参阅《机器学习数学基础》第3章3.1.2节矩阵的迹),则:
λ 1 λ 2 + λ 1 λ 3 + λ 2 λ 3 = ( λ 1 + λ 2 + λ 3 ) 2 − ( λ 1 2 + λ 2 2 + λ 3 2 ) 2 = [ T r ( A ) ] 2 − T r ( A 2 ) 2 \lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3=\frac{(\lambda_1+\lambda_2+\lambda_3)^2-(\lambda_1^2+\lambda_2^2+\lambda_3^2)}{2}=\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2} λ1λ2+λ1λ3+λ2λ3=2(λ1+λ2+λ3)2−(λ12+λ22+λ32)=2[Tr(A)]2−Tr(A2)
又因为 ∣ A ∣ = λ 1 λ 2 λ 3 |\pmb{A}|=\lambda_1\lambda_2\lambda_3 ∣A∣=λ1λ2λ3 ,根据凯莱-哈密顿定理:
p ( A ) = − A 3 + T r ( A ) A 2 − [ T r ( A ) ] 2 − T r ( A 2 ) 2 A + ∣ A ∣ I 3 = 0 p(\pmb{A})=-\pmb{A}^3+Tr(\pmb{A})\pmb{A}^2-\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2}\pmb{A}+|\pmb{A}|\pmb{I}_3=0 p(A)=−A3+Tr(A)A2−2[Tr(A)]2−Tr(A2)A+∣A∣I3=0
上式乘以 1 ∣ A ∣ A − 1 \frac{1}{|\pmb{A}|}\pmb{A}^{-1} ∣A∣1A−1 ,得到 3 × 3 3\times3 3×3 矩阵的逆矩阵的矩阵多项式:
A − 1 = 1 ∣ A ∣ ( A 2 − T r ( A ) A + [ T r ( A ) ] 2 − T r ( A 2 ) 2 I 3 ) \pmb{A}^{-1}=\frac{1}{|\pmb{A}|}\left(\pmb{A}^2-Tr(\pmb{A})\pmb{A}+\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2}\pmb{I}_3\right) A−1=∣A∣1(A2−Tr(A)A+2[Tr(A)]2−Tr(A2)I3)
同时,可以计算 A \pmb{A} A 的伴随矩阵:
a d j A = A 2 − T r ( A ) + [ T r ( A ) ] 2 − T r ( A 2 ) 2 I 3 adj\pmb{A}=\pmb{A}^2-Tr(\pmb{A})+\frac{[Tr(\pmb{A})]^2-Tr(\pmb{A}^2)}{2}\pmb{I}_3 adjA=A2−Tr(A)+2[Tr(A)]2−Tr(A2)I3
3. 可逆矩阵定理和性质总结
3.1 定理
令 A \pmb{A} A 是一个 n × n n\times n n×n 的实矩阵,则以下表述对于可逆矩阵 A \pmb{A} A 是等价的:
-
A \pmb{A} A 是可逆的,或者说存在 A − 1 \pmb{A}^{-1} A−1 满足 A − 1 A = I n \pmb{A}^{-1}\pmb{A}=\pmb{I}_n A−1A=In , I n \pmb{I}_n In 是 n n n 阶单位矩阵。
-
A x = 0 \pmb{Ax}=\pmb{0} Ax=0 仅有平凡解 x = 0 \pmb{x}=\pmb{0} x=0 。
证明:
若 A \pmb{A} A 可逆,对于 A x = 0 \pmb{Ax} = \pmb{0} Ax=0 两侧左乘 A − 1 \pmb{A}^{-1} A−1 。左侧得: A − 1 A x = I x = x \pmb{A}^{-1}\pmb{Ax}=\pmb{Ix}=\pmb{x} A−1Ax=Ix=x ;右侧为: A − 1 0 = 0 \pmb{A}^{-1}\pmb{0}=\pmb{0} A−10=0 。故 x = 0 \pmb{x}=\pmb0 x=0 。
-
A x = b \pmb{Ax}=\pmb{b} Ax=b 有唯一解 x = A − 1 b \pmb{x}=\pmb{A}^{-1}\pmb{b} x=A−1b 。
证明:
假设此方程有两个相异的解 u \pmb{u} u 和 v \pmb{v} v ,由已知方程式,可知:
A ( u − v ) = A u − A v = b − b = 0 \pmb{A}(\pmb{u}-\pmb{v})=\pmb{Au}-\pmb{Av}=\pmb{b}-\pmb{b}=\pmb{0} A(u−v)=Au−Av=b−b=0
即非平凡解满足 A x = 0 \pmb{Ax}=\pmb{0} Ax=0 。故 A x = b \pmb{Ax}=\pmb{b} Ax=b 有唯一解。
-
A \pmb{A} A 有 n n n 个非零主元(pivot)。
-
A \pmb{A} A 的简约行梯形式(reduced row echelon form)为 I n \pmb{I}_n In ,或者说 A \pmb{A} A 行等价于 I n \pmb{I}_n In 。
证明
由第3条唯一解知,增广矩阵 [ A b ] \begin{bmatrix}\pmb{A}&\pmb{b}\end{bmatrix} [Ab] 可化简为 [ I A − 1 b ] \begin{bmatrix}\pmb{I}&\pmb{A}^{-1}\pmb{b}\end{bmatrix} [IA−1b] ,即:
A − 1 [ A b ] = [ A − 1 A A − 1 b ] = [ I A − 1 b ] \pmb{A}^{-1}\begin{bmatrix}\pmb{A}&\pmb{b}\end{bmatrix}=\begin{bmatrix}\pmb{A}^{-1}\pmb{A}&\pmb{A}^{-1}\pmb{b}\end{bmatrix}=\begin{bmatrix}\pmb{I}&\pmb{A}^{-1}\pmb{b}\end{bmatrix} A−1[Ab]=[A−1AA−1b]=[IA−1b]
-
A \pmb{A} A 有线性无关的列向量 (column vector)。
证明
设 [ a 1 ⋯ a n ] \begin{bmatrix}\pmb{a}_1&\cdots&\pmb{a}_n\end{bmatrix} [a1⋯an] 为 A \pmb{A} A 的列向量,则:
[ a 1 ⋯ a n ] [ x 1 ⋮ x n ] = x 1 a 1 + ⋯ + x n a n = 0 \begin{bmatrix}\pmb{a}_1&\cdots&\pmb{a}_n\end{bmatrix}\begin{bmatrix}x_1\\\vdots\\x_n\end{bmatrix}=x_1\pmb{a}_1+\cdots+x_n\pmb{a}_n=\pmb{0} [a1⋯an] x1⋮xn =x1a1+⋯+xnan=0
如果满足第2条定理,则 [ a 1 ⋯ a n ] \begin{bmatrix}\pmb{a}_1&\cdots&\pmb{a}_n\end{bmatrix} [a1⋯an] 各列向量线性无关。
-
A \pmb{A} A 有线性无关的行向量 (row vector)。
证明
假设 A \pmb{A} A 的行向量线性相关,其中必定存在至少一行可表示其他行的線性組合,也就是说对 A \pmb{A} A 进行高斯消元法将会至少有一个零行,于是总的轴数就小于 n n n 。这与第4条定理矛盾。假设不成立。
-
r a n k A = n {\rm{rank}}\pmb{A}=n rankA=n 。
-
A \pmb{A} A 的列空間 (column space) 为 R n \mathbb R^n Rn 或者说线性变换 A : R n → R n \pmb{A}:\mathbb{R}^n\to\mathbb{R}^n A:Rn→Rn 是满射(onto,surjective)。
-
A \pmb{A} A 的行空間 (row space) 为 R n \mathbb{R}^n Rn 。
-
A \pmb{A} A 的零空間 (nullspace) 为 { 0 } \{\pmb{0}\} {0} ,或者说线性变换 A : R n → R n \pmb{A}:\mathbb{R}^n\to\mathbb{R}^n A:Rn→Rn 是一对一(one-to-one,injective)。
-
A T \pmb{A}^{\rm{T}} AT 的零空間为 { 0 } \{\pmb{0}\} {0} 。
-
det A ≠ 0 \det\pmb{A}\ne0 detA=0 。
-
A \pmb{A} A 的特征值不为零。
-
A T A \pmb{A}^{\rm{T}}\pmb{A} ATA 是实对称正定矩阵。
-
A \pmb{A} A 的奇异值(sigular value)大于零。
参考文献
[1]. 对矩阵乘法的深入理解
[2]. 克拉默法则
[3]. https://zh.wikipedia.org/wiki/凱萊--哈密頓定理