机器学习数学基础:13.逆矩阵

一、逆矩阵的定义

(一)定义阐述

在数的乘法运算中,对于非零实数 a a a,存在倒数 1 a \frac{1}{a} a1,使得 a × 1 a = 1 a\times\frac{1}{a} \ = 1 a×a1 =1。逆矩阵的概念与之类似,不过应用于矩阵领域。对于 n n n阶方阵 A A A,若存在唯一的 n n n阶方阵 B B B,满足 A B = B A = E AB \ = BA \ = E AB =BA =E( E E E为 n n n阶单位矩阵,即主对角线元素为 1 1 1,其余元素为 0 0 0的矩阵),则矩阵 B B B称作矩阵 A A A的逆矩阵,记为 A − 1 A^{-1} A−1。这意味着 A A A与 A − 1 A^{-1} A−1相乘,无论顺序如何,结果均为单位矩阵 E E E。

(二)理解示例

以二阶矩阵为例,对于二阶单位矩阵 E = [ 1 0 0 1 ] E \ =\begin{bmatrix}1&0\\0&1\end{bmatrix} E =[1001],设矩阵 A = [ 2 1 1 1 ] A \ =\begin{bmatrix}2&1\\1&1\end{bmatrix} A =[2111],存在矩阵 B = [ 1 − 1 − 1 2 ] B \ =\begin{bmatrix}1& - 1\\ - 1&2\end{bmatrix} B =[1−1−12]。计算可得:
A B = [ 2 × 1 + 1 × ( − 1 ) 2 × ( − 1 ) + 1 × 2 1 × 1 + 1 × ( − 1 ) 1 × ( − 1 ) + 1 × 2 ] = [ 1 0 0 1 ] AB \ =\begin{bmatrix}2\times1 + 1\times(-1)&2\times(-1)+1\times2\\1\times1 + 1\times(-1)&1\times(-1)+1\times2\end{bmatrix} \ =\begin{bmatrix}1&0\\0&1\end{bmatrix} AB =[2×1+1×(−1)1×1+1×(−1)2×(−1)+1×21×(−1)+1×2] =[1001]

B A = [ 1 × 2 + ( − 1 ) × 1 1 × 1 + ( − 1 ) × 1 − 1 ) × 2 + 2 × 1 ( − 1 ) × 1 + 2 × 1 ] = [ 1 0 0 1 ] BA \ =\begin{bmatrix}1\times2 + (-1)\times1&1\times1+(-1)\times1\\-1)\times2 + 2\times1&(-1)\times1+2\times1\end{bmatrix} \ =\begin{bmatrix}1&0\\0&1\end{bmatrix} BA =[1×2+(−1)×1−1)×2+2×11×1+(−1)×1(−1)×1+2×1] =[1001]

所以 B B B是 A A A的逆矩阵,即 A − 1 = [ 1 − 1 − 1 2 ] A^{-1} \ =\begin{bmatrix}1& - 1\\ - 1&2\end{bmatrix} A−1 =[1−1−12]。

二、逆矩阵的性质

(一)可逆性

若矩阵 A A A可逆(即存在 A − 1 A^{-1} A−1),则 A − 1 A^{-1} A−1也可逆,且 ( A − 1 ) − 1 = A (A^{-1})^{-1} \ = A (A−1)−1 =A。这如同 a a a的倒数是 1 a \frac{1}{a} a1, 1 a \frac{1}{a} a1的倒数是 a a a。从定义角度理解,因为 A − 1 A^{-1} A−1满足 A A − 1 = A − 1 A = E AA^{-1} \ = A^{-1}A \ = E AA−1 =A−1A =E,所以 A A A是 A − 1 A^{-1} A−1的逆矩阵,即 ( A − 1 ) − 1 = A (A^{-1})^{-1} \ = A (A−1)−1 =A。

(二)乘法性质

  1. 乘积可逆性 :若 A A A、 B B B均为 n n n阶可逆矩阵,则 A B AB AB也可逆,且 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} \ = B^{-1}A^{-1} (AB)−1 =B−1A−1。这一性质可通过矩阵乘法结合律证明。因为 A B ( B − 1 A − 1 ) = A ( B B − 1 ) A − 1 = A E A − 1 = A A − 1 = E AB(B^{-1}A^{-1}) \ = A(BB^{-1})A^{-1} \ = AEA^{-1} \ = AA^{-1} \ = E AB(B−1A−1) =A(BB−1)A−1 =AEA−1 =AA−1 =E,同理 ( B − 1 A − 1 ) A B = E (B^{-1}A^{-1})AB \ = E (B−1A−1)AB =E,所以 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} \ = B^{-1}A^{-1} (AB)−1 =B−1A−1。例如,若 A = [ 1 2 3 4 ] A \ =\begin{bmatrix}1&2\\3&4\end{bmatrix} A =[1324], B = [ 5 6 7 8 ] B \ =\begin{bmatrix}5&6\\7&8\end{bmatrix} B =[5768],且 A A A、 B B B可逆,那么 A B AB AB的逆矩阵为 B − 1 A − 1 B^{-1}A^{-1} B−1A−1。此性质表明矩阵乘积的逆矩阵,等于各矩阵逆矩阵的反向乘积,顺序不可颠倒。
  2. 数乘可逆性 :若 A A A可逆,数 λ ≠ 0 \lambda\neq0 λ=0,则 λ A \lambda A λA可逆,且 ( λ A ) − 1 = 1 λ A − 1 (\lambda A)^{-1} \ =\frac{1}{\lambda}A^{-1} (λA)−1 =λ1A−1。证明如下: ( λ A ) ( 1 λ A − 1 ) = λ × 1 λ ( A A − 1 ) = E (\lambda A)(\frac{1}{\lambda}A^{-1}) \ =\lambda\times\frac{1}{\lambda}(AA^{-1}) \ = E (λA)(λ1A−1) =λ×λ1(AA−1) =E,同理 ( 1 λ A − 1 ) ( λ A ) = E (\frac{1}{\lambda}A^{-1})(\lambda A) \ = E (λ1A−1)(λA) =E。例如,若 A A A可逆, λ = 3 \lambda \ = 3 λ =3,则 3 A 3A 3A的逆矩阵为 1 3 A − 1 \frac{1}{3}A^{-1} 31A−1。

(三)伴随矩阵与逆矩阵的关系

伴随矩阵 A ∗ A^* A∗与逆矩阵的关系为 A − 1 = 1 ∣ A ∣ A ∗ A^{-1} \ =\frac{1}{|A|}A^* A−1 =∣A∣1A∗( ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0)。伴随矩阵 A ∗ A^* A∗由 A A A的代数余子式构成并转置得到。对于 n n n阶行列式中元素 a i j a_{ij} aij,其代数余子式 A i j = ( − 1 ) i + j M i j A_{ij} \ = (-1)^{i + j}M_{ij} Aij =(−1)i+jMij( M i j M_{ij} Mij为 a i j a_{ij} aij的余子式,即去掉 a i j a_{ij} aij所在行和列后剩余的 n − 1 n - 1 n−1阶行列式)。将所有 A i j A_{ij} Aij构成矩阵并转置即得 A ∗ A^* A∗。当 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0时,可据此求逆矩阵。

(四)转置矩阵的可逆性

若 A A A可逆,则 A T A^T AT也可逆,且 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1} \ = (A^{-1})^T (AT)−1 =(A−1)T。证明如下:因为 A A − 1 = E AA^{-1} \ = E AA−1 =E,两边同时取转置得 ( A A − 1 ) T = E T (AA^{-1})^T \ = E^T (AA−1)T =ET,根据矩阵转置的性质 ( A B ) T = B T A T (AB)^T \ = B^T A^T (AB)T =BTAT,可得 ( A − 1 ) T A T = E (A^{-1})^T A^T \ = E (A−1)TAT =E,同理 A T ( A − 1 ) T = E A^T(A^{-1})^T \ = E AT(A−1)T =E,所以 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1} \ = (A^{-1})^T (AT)−1 =(A−1)T。

三、逆矩阵的求解方法

(一)公式法

对于 n n n阶方阵 A A A,当 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0时,可依公式 A − 1 = 1 ∣ A ∣ A ∗ A^{-1} \ =\frac{1}{|A|}A^* A−1 =∣A∣1A∗求逆矩阵。步骤如下:

  1. 计算 ∣ A ∣ |A| ∣A∣
    • 二阶矩阵 A = [ a b c d ] A \ =\begin{bmatrix}a&b\\c&d\end{bmatrix} A =[acbd], ∣ A ∣ = a d − b c |A| \ = ad - bc ∣A∣ =ad−bc。
    • 三阶矩阵 A = [ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ] A \ =\begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{bmatrix} A = a11a21a31a12a22a32a13a23a33 , ∣ A ∣ = a 11 ( a 22 a 33 − a 23 a 32 ) − a 12 ( a 21 a 33 − a 23 a 31 ) + a 13 ( a 21 a 32 − a 22 a 31 ) |A| \ = a_{11}(a_{22}a_{33}-a_{23}a_{32})-a_{12}(a_{21}a_{33}-a_{23}a_{31})+a_{13}(a_{21}a_{32}-a_{22}a_{31}) ∣A∣ =a11(a22a33−a23a32)−a12(a21a33−a23a31)+a13(a21a32−a22a31)。可利用行列式性质,如某行(列)元素全为 0 0 0,行列式为 0 0 0;交换两行(列),行列式变号;某行(列)元素乘以 k k k,行列式乘以 k k k等,简化计算。
    • 更高阶矩阵行列式计算更复杂,可通过按行(列)展开或化为上(下)三角矩阵计算。
  2. 求 A ∗ A^* A∗ :先求 A A A中各元素代数余子式,再构成矩阵并转置。以三阶矩阵为例,求 a 11 a_{11} a11的代数余子式 A 11 = ( − 1 ) 1 + 1 ∣ a 22 a 23 a 32 a 33 ∣ = a 22 a 33 − a 23 a 32 A_{11} \ = (-1)^{1 + 1}\begin{vmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{vmatrix} \ = a_{22}a_{33}-a_{23}a_{32} A11 =(−1)1+1 a22a32a23a33 =a22a33−a23a32,以此类推求出所有代数余子式,构成矩阵 [ A 11 A 21 A 31 A 12 A 22 A 32 A 13 A 23 A 33 ] \begin{bmatrix}A_{11}&A_{21}&A_{31}\\A_{12}&A_{22}&A_{32}\\A_{13}&A_{23}&A_{33}\end{bmatrix} A11A12A13A21A22A23A31A32A33 ,转置后得 A ∗ A^* A∗。
  3. 代入公式得 A − 1 A^{-1} A−1 :将 ∣ A ∣ |A| ∣A∣和 A ∗ A^* A∗代入公式求出 A − 1 A^{-1} A−1。此方法对高阶矩阵计算量大。

(四)特殊公式法

设 n n n阶矩阵 A A A满足 A 2 − 2 A − 3 E = O A^2 - 2A - 3E \ = O A2−2A−3E =O。

  1. 由 A 2 − 2 A − 3 E = O A^2 - 2A - 3E \ = O A2−2A−3E =O,移项得 A 2 − 2 A = 3 E A^2 - 2A \ = 3E A2−2A =3E。
  2. 变形为 A ( A − 2 E ) = 3 E A(A - 2E) \ = 3E A(A−2E) =3E。
  3. 两边乘 1 3 \frac{1}{3} 31,得 A ⋅ 1 3 ( A − 2 E ) = E A\cdot\frac{1}{3}(A - 2E) \ = E A⋅31(A−2E) =E,所以 A A A可逆,且 A − 1 = 1 3 ( A − 2 E ) A^{-1} \ =\frac{1}{3}(A - 2E) A−1 =31(A−2E)。

此方法是根据矩阵满足的等式,凑出 A B = E AB \ = E AB =E的形式确定逆矩阵。

四、判断矩阵是否可逆

(一)行列式判别法

对于 n n n阶方阵 A A A,若 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0,则 A A A可逆;若 ∣ A ∣ = 0 |A| \ = 0 ∣A∣ =0,则 A A A不可逆。这是因为逆矩阵定义中 A A − 1 = E AA^{-1} \ = E AA−1 =E,两边取行列式得 ∣ A ∣ × ∣ A − 1 ∣ = ∣ E ∣ = 1 |A|\times|A^{-1}| \ = |E| \ = 1 ∣A∣×∣A−1∣ =∣E∣ =1,所以 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0。

五、矩阵方程的求解

对于矩阵方程 A X B = C AXB \ = C AXB =C( A A A、 B B B、 X X X、 C C C均为矩阵):

  1. 判断可逆性 :计算 ∣ A ∣ |A| ∣A∣和 ∣ B ∣ |B| ∣B∣,若 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0且 ∣ B ∣ ≠ 0 |B|\neq0 ∣B∣=0,则 A A A、 B B B可逆。
  2. 求解 X X X :当 A A A、 B B B可逆时,方程两边左乘 A − 1 A^{-1} A−1,右乘 B − 1 B^{-1} B−1,得 A − 1 A X B B − 1 = A − 1 C B − 1 A^{-1}AXBB^{-1} \ = A^{-1}CB^{-1} A−1AXBB−1 =A−1CB−1,即 X = A − 1 C B − 1 X \ = A^{-1}CB^{-1} X =A−1CB−1。
  3. 计算 X X X :求出 A − 1 A^{-1} A−1、 B − 1 B^{-1} B−1,按矩阵乘法规则计算 A − 1 C B − 1 A^{-1}CB^{-1} A−1CB−1。

例如, A = [ 1 0 0 2 ] A \ =\begin{bmatrix}1&0\\0&2\end{bmatrix} A =[1002], B = [ 3 0 0 4 ] B \ =\begin{bmatrix}3&0\\0&4\end{bmatrix} B =[3004], C = [ 5 6 7 8 ] C \ =\begin{bmatrix}5&6\\7&8\end{bmatrix} C =[5768], A A A、 B B B可逆, A − 1 = [ 1 0 0 1 2 ] A^{-1} \ =\begin{bmatrix}1&0\\0&\frac{1}{2}\end{bmatrix} A−1 =[10021], B − 1 = [ 1 3 0 0 1 4 ] B^{-1} \ =\begin{bmatrix}\frac{1}{3}&0\\0&\frac{1}{4}\end{bmatrix} B−1 =[310041]。
A − 1 C = [ 1 0 0 1 2 ] [ 5 6 7 8 ] = [ 5 6 7 2 4 ] A^{-1}C \ =\begin{bmatrix}1&0\\0&\frac{1}{2}\end{bmatrix}\begin{bmatrix}5&6\\7&8\end{bmatrix} \ =\begin{bmatrix}5&6\\\frac{7}{2}&4\end{bmatrix} A−1C =[10021][5768] =[52764]
X = A − 1 C B − 1 = [ 5 6 7 2 4 ] [ 1 3 0 0 1 4 ] = [ 5 3 3 2 7 6 1 ] X \ = A^{-1}CB^{-1} \ =\begin{bmatrix}5&6\\\frac{7}{2}&4\end{bmatrix}\begin{bmatrix}\frac{1}{3}&0\\0&\frac{1}{4}\end{bmatrix} \ =\begin{bmatrix}\frac{5}{3}&\frac{3}{2}\\\frac{7}{6}&1\end{bmatrix} X =A−1CB−1 =[52764][310041] =[3567231]

通过以上全面的介绍,涵盖了逆矩阵从定义到性质、求解方法、可逆判断以及矩阵方程求解等各方面内容,有助于深入理解和运用逆矩阵知识。

接下来,换一种更直观的方式解释为什么 A ∗ A = A A ∗ = ∣ A ∣ E A^*A \ = AA^* \ = |A|E A∗A =AA∗ =∣A∣E,我们从二阶矩阵入手详细说明,之后再推广到 n n n阶矩阵的情况。

一、二阶矩阵的情况

设二阶方阵 A = [ a 11 a 12 a 21 a 22 ] A \ = \begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix} A =[a11a21a12a22]。

(一)求伴随矩阵 A ∗ A^* A∗

先求 A A A中各元素的代数余子式:

  • a 11 a_{11} a11的余子式 M 11 = a 22 M_{11} \ = a_{22} M11 =a22,代数余子式 A 11 = ( − 1 ) 1 + 1 M 11 = a 22 A_{11} \ = (-1)^{1 + 1}M_{11} \ = a_{22} A11 =(−1)1+1M11 =a22。

  • a 12 a_{12} a12的余子式 M 12 = a 21 M_{12} \ = a_{21} M12 =a21,代数余子式 A 12 = ( − 1 ) 1 + 2 M 12 = − a 21 A_{12} \ = (-1)^{1 + 2}M_{12} \ = -a_{21} A12 =(−1)1+2M12 =−a21。

  • a 21 a_{21} a21的余子式 M 21 = a 12 M_{21} \ = a_{12} M21 =a12,代数余子式 A 21 = ( − 1 ) 2 + 1 M 21 = − a 12 A_{21} \ = (-1)^{2 + 1}M_{21} \ = -a_{12} A21 =(−1)2+1M21 =−a12。

  • a 22 a_{22} a22的余子式 M 22 = a 11 M_{22} \ = a_{11} M22 =a11,代数余子式 A 22 = ( − 1 ) 2 + 2 M 22 = a 11 A_{22} \ = (-1)^{2 + 2}M_{22} \ = a_{11} A22 =(−1)2+2M22 =a11。

那么伴随矩阵 A ∗ = [ A 11 A 21 A 12 A 22 ] = [ a 22 − a 12 − a 21 a 11 ] A^* \ =\begin{bmatrix}A_{11}&A_{21}\\A_{12}&A_{22}\end{bmatrix} \ =\begin{bmatrix}a_{22}&-a_{12}\\-a_{21}&a_{11}\end{bmatrix} A∗ =[A11A12A21A22] =[a22−a21−a12a11]。

(二)计算 A ∗ A A^*A A∗A

A ∗ A = [ a 22 − a 12 − a 21 a 11 ] [ a 11 a 12 a 21 a 22 ] = [ a 22 a 11 + ( − a 12 ) a 21 a 22 a 12 + ( − a 12 ) a 22 − a 21 a 11 + a 11 a 21 − a 21 a 12 + a 11 a 22 ] = [ a 11 a 22 − a 12 a 21 0 0 a 11 a 22 − a 12 a 21 ] \begin{align*} A^*A&\ =\begin{bmatrix}a_{22}&-a_{12}\\-a_{21}&a_{11}\end{bmatrix}\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\\ &\ =\begin{bmatrix}a_{22}a_{11}+(-a_{12})a_{21}&a_{22}a_{12}+(-a_{12})a_{22}\\-a_{21}a_{11}+a_{11}a_{21}&-a_{21}a_{12}+a_{11}a_{22}\end{bmatrix}\\ &\ =\begin{bmatrix}a_{11}a_{22}-a_{12}a_{21}&0\\0&a_{11}a_{22}-a_{12}a_{21}\end{bmatrix} \end{align*} A∗A =[a22−a21−a12a11][a11a21a12a22] =[a22a11+(−a12)a21−a21a11+a11a21a22a12+(−a12)a22−a21a12+a11a22] =[a11a22−a12a2100a11a22−a12a21]

而二阶矩阵 A A A的行列式 ∣ A ∣ = a 11 a 22 − a 12 a 21 |A| \ = a_{11}a_{22}-a_{12}a_{21} ∣A∣ =a11a22−a12a21,所以 A ∗ A = [ ∣ A ∣ 0 0 ∣ A ∣ ] = ∣ A ∣ [ 1 0 0 1 ] = ∣ A ∣ E A^*A \ =\begin{bmatrix}|A|&0\\0&|A|\end{bmatrix} \ = |A|\begin{bmatrix}1&0\\0&1\end{bmatrix} \ = |A|E A∗A =[∣A∣00∣A∣] =∣A∣[1001] =∣A∣E。

(三)计算 A A ∗ AA^* AA∗

A A ∗ = [ a 11 a 12 a 21 a 22 ] [ a 22 − a 12 − a 21 a 11 ] = [ a 11 a 22 + a 12 ( − a 21 ) a 11 ( − a 12 ) + a 12 a 11 a 21 a 22 + a 22 ( − a 21 ) a 21 ( − a 12 ) + a 22 a 11 ] = [ a 11 a 22 − a 12 a 21 0 0 a 11 a 22 − a 12 a 21 ] = ∣ A ∣ E \begin{align*} AA^*&\ =\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}a_{22}&-a_{12}\\-a_{21}&a_{11}\end{bmatrix}\\ &\ =\begin{bmatrix}a_{11}a_{22}+a_{12}(-a_{21})&a_{11}(-a_{12})+a_{12}a_{11}\\a_{21}a_{22}+a_{22}(-a_{21})&a_{21}(-a_{12})+a_{22}a_{11}\end{bmatrix}\\ &\ =\begin{bmatrix}a_{11}a_{22}-a_{12}a_{21}&0\\0&a_{11}a_{22}-a_{12}a_{21}\end{bmatrix}\\ &\ =|A|E \end{align*} AA∗ =[a11a21a12a22][a22−a21−a12a11] =[a11a22+a12(−a21)a21a22+a22(−a21)a11(−a12)+a12a11a21(−a12)+a22a11] =[a11a22−a12a2100a11a22−a12a21] =∣A∣E

相关推荐
@心都2 小时前
机器学习数学基础:19.线性相关与线性无关
线性代数·机器学习·概率论
张同学的IT技术日记2 小时前
线性代数于工程应用中的实践:以代码实例拆解相似性度量问题的求解逻辑
开发语言·笔记·python·学习·线性代数·工程应用
张同学的IT技术日记3 小时前
线性代数于工程应用中的实践:以代码实例拆解图像平滑问题的求解逻辑
开发语言·笔记·python·学习·线性代数·工程应用
CS创新实验室4 小时前
《机器学习数学基础》补充资料:秩-零化度定理
人工智能·决策树·机器学习
沉默的舞台剧5 小时前
【深度学习入门_机器学习理论】决策树(Decision Tree)
深度学习·决策树·机器学习
IPdodo全球网络服务5 小时前
Facebook矩阵营销:多维度布局,精准打击
矩阵·facebook
studyer_domi5 小时前
matlab simulink LNG广义预测控制
人工智能·机器学习·matlab
giszz5 小时前
关于自动驾驶的等级划分
人工智能·机器学习·自动驾驶
wzx_Eleven6 小时前
【论文阅读】On the Security of “VOSA“
论文阅读·人工智能·机器学习·网络安全