线性代数的本质(五)——矩阵的运算

文章目录

矩阵的运算

矩阵的转置

转置 :矩阵 A A A的行列互换得到的矩阵称为 A A A 的转置(transpose),记作 A T A^T AT。

性质:矩阵转置运算满足下列性质:

  1. ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
  2. ( A T ) T = A (A^T)^T=A (AT)T=A
  3. ( k A ) T = k A T (kA)^T=kA^T (kA)T=kAT
  4. ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT
  5. ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T

方阵的运算

三角矩阵 :(triangular matrix)主对角线的下方元素都是零的方阵,称为上三角矩阵 。类似的,主对角线的上方元素都是零的方阵,称为下三角矩阵

a 11 a 12 ⋯ a 1 n a 22 ⋯ a 2 n ⋱ ⋮ a n n \] , \[ a 11 a 21 a 22 ⋮ ⋮ ⋱ a n 1 a n 2 ⋯ a n n \] \\begin{bmatrix} a_{11}\&a_{12}\&\\cdots\&a_{1n} \\\\ \&a_{22}\&\\cdots\&a_{2n} \\\\ \&\&\\ddots\&\\vdots \\\\ \&\&\&a_{nn} \\\\ \\end{bmatrix},\\quad \\begin{bmatrix} a_{11}\&\&\& \\\\ a_{21}\&a_{22}\&\& \\\\ \\vdots\&\\vdots\&\\ddots\& \\\\ a_{n1}\&a_{n2}\&\\cdots\&a_{nn} \\\\ \\end{bmatrix} a11a12a22⋯⋯⋱a1na2n⋮ann , a11a21⋮an1a22⋮an2⋱⋯ann **上(下)三角阵的行列式为主对角线元素的乘积** det ⁡ A = a 11 a 22 ⋯ a n n \\det A=a_{11}a_{22}\\cdots a_{nn} detA=a11a22⋯ann **对角阵** :不在主对角线上的元素全为零的矩阵称为**对角阵** (diagonal matrix),记作 d i a g ( a 1 , a 2 , ⋯   , a n ) = \[ a 1 a 2 ⋱ a n \] \\mathrm{diag}(a_1,a_2,\\cdots,a_n)=\\begin{bmatrix} a_1 \\\\ \&a_2 \\\\ \&\&\\ddots \\\\ \&\&\&a_n \\\\ \\end{bmatrix} diag(a1,a2,⋯,an)= a1a2⋱an 对角阵有良好的性质: 1. 两对角阵的乘积仍为对角阵 \[ a 1 a 2 ⋱ a n \] \[ b 1 b 2 ⋱ b n \] = \[ a 1 b 1 a 2 b 2 ⋱ a n b n \] \\begin{bmatrix}a_1 \\\\\&a_2 \\\\\&\&\\ddots \\\\\&\&\&a_n \\end{bmatrix} \\begin{bmatrix}b_1 \\\\\&b_2 \\\\\&\&\\ddots \\\\\&\&\&b_n \\end{bmatrix}= \\begin{bmatrix}a_1b_1 \\\\\&a_2b_2 \\\\\&\&\\ddots \\\\\&\&\&a_nb_n \\end{bmatrix} a1a2⋱an b1b2⋱bn = a1b1a2b2⋱anbn 2. 对角阵的幂仍为对角阵 \[ a 1 a 2 ⋱ a n \] k = \[ a 1 k a 2 k ⋱ a n k \] \\begin{bmatrix}a_1 \\\\\&a_2 \\\\\&\&\\ddots \\\\\&\&\&a_n \\end{bmatrix}\^k= \\begin{bmatrix}a_1\^k \\\\\&a_2\^k \\\\\&\&\\ddots \\\\\&\&\&a_n\^k \\end{bmatrix} a1a2⋱an k= a1ka2k⋱ank **数量阵** :主对角线上的元素都相等的对角阵,称为**数量阵** (scalar matrix)。 d i a g ( a , a , ⋯   , a ) = \[ a a ⋱ a \] \\mathrm{diag}(a,a,\\cdots,a)=\\begin{bmatrix} a \\\\ \&a \\\\ \&\&\\ddots \\\\ \&\&\&a \\\\ \\end{bmatrix} diag(a,a,⋯,a)= aa⋱a 数量阵得名于它的乘法。如二阶数量阵 \[ k 0 0 k \] A = k \[ 1 0 0 1 \] A = k A \\begin{bmatrix}k\&0 \\\\ 0\&k \\end{bmatrix}A=k\\begin{bmatrix}1\&0 \\\\ 0\&1 \\end{bmatrix}A=kA \[k00k\]A=k\[1001\]A=kA **单位阵** :主对角线上的元素全为1的对角阵,称为**单位阵** (identity matrix)。 n n n 阶单位阵记作 E n E_n En或 I n I_n In。任何矩阵与单位阵的乘积都等于自身。 I 3 = \[ 1 0 0 0 1 0 0 0 1 \] I_3=\\begin{bmatrix}1\&0\&0 \\\\0\&1\&0 \\\\0\&0\&1 \\\\ \\end{bmatrix} I3= 100010001 **对称阵** 与**反对称阵** :设 A = ( a i j ) A=(a_{ij}) A=(aij) 为 n n n阶方阵,若 A T = A A\^T=A AT=A ,即 a i j = a j i a_{ij}=a_{ji} aij=aji,则称为**对称阵** (symmetric matrix);若 A T = − A A\^T=-A AT=−A ,即 a i j = − a j i a_{ij}=-a_{ji} aij=−aji,则称为**反对称阵**(skew-symmetric matrix)。 易证明 A A T AA\^T AAT 和 A T A A\^TA ATA 是对称阵。 **方阵的幂** :由于矩阵满足结合律,我们可以定义矩阵的幂运算 A 0 = I , A n = A A ⋯ A ⏞ n A\^0=I,\\quad A\^n=\\overbrace{AA\\cdots A}\^n A0=I,An=AA⋯A n 当矩阵 A A A 可逆时,定义 A − k = ( A − 1 ) k A\^{-k}=(A\^{-1})\^k A−k=(A−1)k 显然只有方阵的幂才有意义。幂运算满足如下性质: 1. A k A l = A k + l A\^kA\^l=A\^{k+l} AkAl=Ak+l 2. ( A k ) l = A k l (A\^k)\^l=A\^{kl} (Ak)l=Akl 注意:因为矩阵乘法无交换率,因此一般情况下 ( A B ) k ≠ A k B k (AB)\^k\\neq A\^kB\^k (AB)k=AkBk ## 初等矩阵 **初等变换** :矩阵初等行变换的定义同样适用于列,相应的记法为 c i ↔ c j , k c i , c i + k c j c_i\\lrarr c_j,kc_i,c_i+kc_j ci↔cj,kci,ci+kcj 。矩阵的初等行变换和初等列变换统称矩阵的**初等变换** 。若矩阵 A A A 经有限次初等变换变为 B B B,则称 A A A与 B B B **等价**(equivalent) 。 矩阵的初等变换是矩阵的一种最基本运算,其过程可以通过特殊矩阵的乘法来表示。 初等矩阵:由单位矩阵进行一次初等变换得到的矩阵称为**初等矩阵**(elementary matrix)。易知初等矩阵都是可逆的。 三种初等变换对应着三种初等矩阵。由矩阵的乘法运算可以验证:**对矩阵的初等行变换相当于左乘相应的初等矩阵;对矩阵的初等列变换相当于右乘相应的初等矩阵**。 1. 互换变换,如 r 1 ↔ r 2 r_1\\lrarr r_2 r1↔r2 \[ 0 1 0 1 0 0 0 0 1 \] \[ a 1 b 1 a 2 b 2 a 3 b 3 \] = \[ a 2 b 2 a 1 b 1 a 3 b 3 \] \\begin{bmatrix}0\&1\&0 \\\\1\&0\&0\\\\0\&0\&1\\end{bmatrix} \\begin{bmatrix}a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix}= \\begin{bmatrix}a_2\&b_2\\\\a_1\&b_1 \\\\a_3\&b_3\\end{bmatrix} 010100001 a1a2a3b1b2b3 = a2a1a3b2b1b3 2. 倍乘变换,如 2 r 1 2r_1 2r1 \[ 2 0 0 0 1 0 0 0 1 \] \[ a 1 b 1 a 2 b 2 a 3 b 3 \] = \[ 2 a 1 b 1 a 2 b 2 a 3 b 3 \] \\begin{bmatrix}2\&0\&0 \\\\0\&1\&0\\\\0\&0\&1\\end{bmatrix} \\begin{bmatrix}a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix}= \\begin{bmatrix}2a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix} 200010001 a1a2a3b1b2b3 = 2a1a2a3b1b2b3 3. 倍加变换,如 r 1 + 2 r 2 r_1+2r_2 r1+2r2 \[ 1 2 0 0 1 0 0 0 1 \] \[ a 1 b 1 a 2 b 2 a 3 b 3 \] = \[ a 1 + 2 a 2 b 1 + 2 b 2 a 2 b 2 a 3 b 3 \] \\begin{bmatrix}1\&2\&0 \\\\0\&1\&0\\\\0\&0\&1\\end{bmatrix} \\begin{bmatrix}a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix}= \\begin{bmatrix}a_1+2a_2\&b_1+2b_2 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix} 100210001 a1a2a3b1b2b3 = a1+2a2a2a3b1+2b2b2b3 定理:任意一个可逆矩阵都可以表示为有限个初等矩阵的乘积。 由于初等矩阵可逆,所以初等矩阵的乘积亦可逆。 所有矩阵都可通过初等变换化为**标准型** \[ 1 ⋱ 1 } r 0 ⋱ 0 \] = \[ I r O O O \] \\begin{bmatrix} \\left.\\begin{matrix}1\&\& \\\\ \&\\ddots\&\\\\\&\&1\\end{matrix}\\right\\}r \& \\\\ \&\\begin{matrix}0 \\\\ \&\\ddots\&\\\\\&\&0\\end{matrix} \\end{bmatrix}= \\begin{bmatrix}I_r\&O \\\\O\&O\\end{bmatrix} 1⋱1⎭ ⎬ ⎫r0⋱0 =\[IrOOO

分块矩阵

分块矩阵是矩阵运算的一种技巧。

在矩阵的运算和理论研究中,有时对矩阵进行分块处理,常常会简化矩阵的运算,或者使原矩阵显得结构简单而清晰。

1 0 0 0 0 1 0 0 0 0 1 5 \] = \[ I 2 O O A \] \\begin{bmatrix} \\begin{array}{cc:cc} 1\&0 \& 0 \& 0 \\\\ 0\&1 \& 0 \&0 \\\\ \\hdashline 0\&0 \& 1 \& 5 \\end{array}\\end{bmatrix} =\\begin{bmatrix} I_2 \& O \\\\ O \& A \\end{bmatrix} 100010001005 =\[I2OOA

像这样,结合矩阵本身的特点,把一个矩阵用横线和竖线划分为若干个子块,并以所分的子块为元素的矩阵称为分块矩阵(Block matrix)。一个矩阵可用不同的方法分块。

分块矩阵的运算形式上和普通矩阵相同,把子块当成元素计算即可。

加法 :设分块 A , B A,B A,B 是同型矩阵,且对它们的分法相同,则 A + B = ( A i j + B i j ) A+B=(A_{ij}+B_{ij}) A+B=(Aij+Bij)

A 1 B 1 C 1 D 1 \] + \[ A 2 B 2 C 2 D 2 \] = \[ A 1 + A 2 B 1 + B 2 C 1 + C 2 D 1 + D 2 \] \\begin{bmatrix}A_1 \& B_1 \\\\C_1 \& D_1 \\end{bmatrix}+ \\begin{bmatrix}A_2 \& B_2 \\\\C_2 \& D_2 \\end{bmatrix}=\\begin{bmatrix}A_1+A_2 \& B_1+B_2 \\\\C_1+C_2 \& D_1+D_2 \\end{bmatrix} \[A1C1B1D1\]+\[A2C2B2D2\]=\[A1+A2C1+C2B1+B2D1+D2

数乘 :分块矩阵 A A A ,数乘作用于每个子块。
k [ A B C D ] = [ k A k B k C k D ] k\begin{bmatrix}A & B \\C & D \end{bmatrix}=\begin{bmatrix}kA & kB \\kC & kD \end{bmatrix} k[ACBD]=[kAkCkBkD]
乘法 :分块矩阵的乘法按矩阵乘法的形式计算。
A B = A [ b 1 b 2 ⋯ b p ] = [ A b 1 A b 2 ⋯ A b p ] AB=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_p\end{bmatrix}= \begin{bmatrix}A\mathbf b_1&A\mathbf b_2&\cdots&A\mathbf b_p\end{bmatrix} AB=A[b1b2⋯bp]=[Ab1Ab2⋯Abp]

矩阵乘法的列行展开
A B = [ a 1 a 2 ⋯ a n ] [ b 1 b 2 ⋮ b n ] = a 1 b 1 + a 2 b 2 + ⋯ + a n b n AB=\begin{bmatrix}\mathbf a_1&\mathbf a_2&\cdots&\mathbf a_n\end{bmatrix} \begin{bmatrix}\mathbf b_1\\\mathbf b_2\\\vdots\\\mathbf b_n\end{bmatrix} =\mathbf a_1\mathbf b_1+\mathbf a_2\mathbf b_2+\cdots+\mathbf a_n\mathbf b_n AB=[a1a2⋯an] b1b2⋮bn =a1b1+a2b2+⋯+anbn
转置 :分块矩阵 A = ( A i j ) A=(A_{ij}) A=(Aij) 的转置等于各子块的转置 A T = ( A i j T ) A^T=(A_{ij}^T) AT=(AijT)

分块上三角矩阵

A B O D \] − 1 = \[ A − 1 − A − 1 B D − 1 O D − 1 \] \\begin{bmatrix}A\&B\\\\O\&D\\end{bmatrix}\^{-1}= \\begin{bmatrix}A\^{-1}\&-A\^{-1}BD\^{-1}\\\\O\&D\^{-1}\\end{bmatrix} \[AOBD\]−1=\[A−1O−A−1BD−1D−1

设分块矩阵 [ X 1 X 2 X 3 X 4 ] \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} [X1X3X2X4] 是矩阵 [ A B O D ] \begin{bmatrix}A&B\\O&D\end{bmatrix} [AOBD] 的逆,则

A B O D \] \[ X 1 X 2 X 3 X 4 \] = \[ I p O O I q \] \\begin{bmatrix}A\&B\\\\O\&D\\end{bmatrix} \\begin{bmatrix}X_1\&X_2\\\\X_3\&X_4\\end{bmatrix} =\\begin{bmatrix}I_p\&O\\\\O\&I_q\\end{bmatrix} \[AOBD\]\[X1X3X2X4\]=\[IpOOIq

这个矩阵方程包含了4个未知子块的方程
A X 1 + B X 3 = I p A X 2 + B X 4 = O D X 3 = O D X 4 = I q AX_1+BX_3=I_p \\ AX_2+BX_4=O \\ DX_3=O \\ DX_4=I_q AX1+BX3=IpAX2+BX4=ODX3=ODX4=Iq

若 D D D 可逆,从后两个方程可以得到 X 3 = O , X 4 = D − 1 X_3=O,X_4=D^{-1} X3=O,X4=D−1 ;若 A A A 可逆,进一步可以得到 X 1 = A − 1 , X 2 = − A − 1 B D − 1 X_1=A^{-1},X_2=-A^{-1}BD^{-1} X1=A−1,X2=−A−1BD−1 。便可获得分块上三角矩阵的逆。

分块对角矩阵:分块对角矩阵拥有良好的性质。

(1) 分块对角矩阵乘积

A 1 A 2 ⋱ A s \] \[ B 1 B 2 ⋱ B s \] = \[ A 1 B 1 A 2 B 2 ⋱ A s B s \] \\begin{bmatrix}A_1 \\\\\&A_2 \\\\\&\&\\ddots \\\\\&\&\&A_s \\end{bmatrix} \\begin{bmatrix}B_1 \\\\\&B_2 \\\\\&\&\\ddots \\\\\&\&\&B_s \\end{bmatrix} =\\begin{bmatrix}A_1B_1 \\\\\&A_2B_2 \\\\\&\&\\ddots \\\\\&\&\&A_sB_s \\end{bmatrix} A1A2⋱As B1B2⋱Bs = A1B1A2B2⋱AsBs (2) 若分块对角矩阵的各个子块可逆,则该对角分块矩阵可逆 \[ A 1 A 2 ⋱ A s \] − 1 = \[ A 1 − 1 A 2 − 1 ⋱ A s − 1 \] \\begin{bmatrix}A_1 \\\\\&A_2 \\\\\&\&\\ddots \\\\\&\&\&A_s \\end{bmatrix}\^{-1}= \\begin{bmatrix}A_1\^{-1} \\\\\&A_2\^{-1} \\\\\&\&\\ddots \\\\\&\&\&A_s\^{-1} \\end{bmatrix} A1A2⋱As −1= A1−1A2−1⋱As−1 (3) 分块对角矩阵的行列式为对角位置的行列式乘积 det ⁡ \[ A 1 A 2 ⋱ A s \] = det ⁡ A 1 det ⁡ A 2 ⋯ det ⁡ A s \\det\\begin{bmatrix}A_1 \\\\\&A_2 \\\\\&\&\\ddots \\\\\&\&\&A_s \\end{bmatrix} =\\det A_1\\det A_2\\cdots\\det A_s det A1A2⋱As =detA1detA2⋯detAs ## 逆矩阵 利用克拉默法可以容易地导出一个求矩阵的逆的一般公式。设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\\times n} A=(aij)n×n 的逆矩阵 A − 1 = ( b i j ) n × n A\^{-1}=(b_{ij})_{n\\times n} A−1=(bij)n×n ,利用分块矩阵的乘法 A A − 1 = A \[ b 1 b 2 ⋯ b n \] = I n = \[ e 1 e 2 ⋯ e n \] AA\^{-1}=A\\begin{bmatrix}\\mathbf b_1\&\\mathbf b_2\&\\cdots\&\\mathbf b_n\\end{bmatrix} =I_n=\\begin{bmatrix}\\mathbf e_1\&\\mathbf e_2\&\\cdots\&\\mathbf e_n\\end{bmatrix} AA−1=A\[b1b2⋯bn\]=In=\[e1e2⋯en

其中 b j \mathbf b_j bj 是矩阵 A − 1 A^{-1} A−1 的第 j j j 列, e j \mathbf e_j ej 是单位阵 I n I_n In 的第 j j j 列。于是
A b j = e j A\mathbf b_j=\mathbf e_j Abj=ej

向量 b j \mathbf b_j bj 的第 i i i 个元素是 A − 1 A^{-1} A−1 的元素 b i j b_{ij} bij 。由克拉默法则求得
b i j = det ⁡ A i ( e j ) det ⁡ A b_{ij}=\frac{\det A_i(\mathbf e_j)}{\det A} bij=detAdetAi(ej)

回顾代数余子式的定义,它是把矩阵 A A A 中元素 a i j a_{ij} aij 所在的行和列划掉后得到的。 det ⁡ A i ( e j ) \det A_i(\mathbf e_j) detAi(ej) 按第 i i i 列的余子展开式为
det ⁡ A i ( e j ) = ( − 1 ) i + j M j i = A j i \det A_i(\mathbf e_j)=(-1)^{i+j}M_{ji}=A_{ji} detAi(ej)=(−1)i+jMji=Aji

于是可写出矩阵 A A A 的逆
A − 1 = 1 det ⁡ A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A

其中 adj A \text{adj }A adj A 是矩阵 A A A 的各个元素的代数余子式 A j i A_{ji} Aji 所构成的矩阵
adj A = [ A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ] \text{adj }A=\begin{bmatrix} A_{11}&A_{21}&\cdots&A_{n1} \\ A_{12}&A_{22}&\cdots&A_{n2} \\ \vdots&\vdots&\ddots&\vdots \\ A_{1n}&A_{2n}&\cdots&A_{nn} \\ \end{bmatrix} adj A= A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann

做矩阵 A A A的伴随矩阵(Adjugate Matrix) 。

注意,伴随矩阵里代数余子式的排列顺序是颠倒的。

定理:方阵 A A A 可逆的充要条件是 det ⁡ A ≠ 0 \det A\neq0 detA=0 ,且 A − 1 = 1 det ⁡ A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A

此定理仅适用于理论上的计算矩阵的逆,使我们不用实际计算出 A − 1 A^{-1} A−1 就可以推导出性质。

这里给出二阶方阵 A = [ a b c d ] A=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆,若 det ⁡ A = a d − b c ≠ 0 \det A=ad-bc\neq0 detA=ad−bc=0 则
A − 1 = 1 a d − b c [ d − b − c a ] A^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=ad−bc1[d−c−ba]

推论

  1. 若 n n n 阶方阵 A , B A,B A,B 满足 A B = I AB=I AB=I 或 B A = I BA=I BA=I ,则 B = A − 1 B=A^{-1} B=A−1 。
  2. A ( adj A ) = ( adj A ) A = ( det ⁡ A ) I A(\text{adj }A)=(\text{adj }A)A=(\det A)I A(adj A)=(adj A)A=(detA)I

有了推论1,只需判断 A B = I AB=I AB=I 或 B A = I BA=I BA=I 中的一个条件就可判定逆矩阵,要比定义简单一些。

利用初等变换计算逆矩阵 :写出增广矩阵 ( A ∣ I ) (A\mid I) (A∣I), 用初等行变换把左边矩阵 A A A 处化为单位矩阵 I I I ,则右边出来的就是逆矩阵 A − 1 A^{-1} A−1,示意如下:
( A ∣ I ) → ( I ∣ A − 1 ) (A\mid I)\xrightarrow{}(I\mid A^{-1}) (A∣I) (I∣A−1)

同样,利用初等列变换计算逆矩阵的示意如下

A I \] → \[ I A − 1 \] \\begin{bmatrix}A\\\\I\\end{bmatrix}\\xrightarrow{}\\begin{bmatrix}I\\\\A\^{-1}\\end{bmatrix} \[AI\] \[IA−1

示例:解矩阵方程

1 0 1 − 1 1 1 2 − 1 1 \] \[ x 1 y 1 x 2 y 2 x 3 y 3 \] = \[ 1 1 0 1 − 1 0 \] \\begin{bmatrix}1\&0\&1\\\\-1\&1\&1\\\\2\&-1\&1\\end{bmatrix} \\begin{bmatrix}x_1\&y_1\\\\x_2\&y_2\\\\x_3\&y_3\\\\\\end{bmatrix}= \\begin{bmatrix}1\&1\\\\0\&1\\\\-1\&0\\\\\\end{bmatrix} 1−1201−1111 x1x2x3y1y2y3 = 10−1110 解:系数矩阵可逆的矩阵方程 A X = B AX=B AX=B ,解为 X = A − 1 B X=A\^{-1}B X=A−1B 。实际中,不必求逆矩阵,可使用一系列初等变换求解,即系数矩阵和常数项做同样的变换 P = A − 1 P=A\^{-1} P=A−1。图示如下 ( A ∣ B ) → ( I ∣ X ) (A\\mid B)\\xrightarrow{}(I\\mid X) (A∣B) (I∣X) 本例计算过程如下 \[ 1 0 1 1 1 − 1 1 1 0 1 2 − 1 1 − 1 0 \] → \[ 1 0 0 3 1 0 1 0 5 2 0 0 1 − 2 0 \] \\begin{bmatrix} \\begin{array}{ccc:cc} 1\&0\&1\&1\&1\\\\ -1\&1\&1\&0\&1\\\\ 2\&-1\&1\&-1\&0 \\end{array} \\end{bmatrix}\\to \\begin{bmatrix} \\begin{array}{ccc:cc} 1\&0\&0\&3\&1\\\\ 0\&1\&0\&5\&2\\\\ 0\&0\&1\&-2\&0 \\end{array} \\end{bmatrix} 1−1201−111110−1110 → 10001000135−2120 故 \[ x 1 y 1 x 2 y 2 x 3 y 3 \] = \[ 3 1 5 2 − 2 0 \] \\begin{bmatrix}x_1\&y_1\\\\x_2\&y_2\\\\x_3\&y_3\\end{bmatrix}= \\begin{bmatrix}3\&1\\\\5\&2\\\\-2\&0\\end{bmatrix} x1x2x3y1y2y3 = 35−2120 ## 矩阵的秩 **行空间** :矩阵 A = ( r 1 , r 2 , ⋯   , r m ) T A=(\\mathbf r_1,\\mathbf r_2,\\cdots,\\mathbf r_m)\^T A=(r1,r2,⋯,rm)T 的所有行向量张成的空间称为 A A A 的行空间,记为 row A = span { r 1 , r 2 , ⋯   , r m } \\text{row }A=\\text{span}\\{\\mathbf r_1,\\mathbf r_2,\\cdots,\\mathbf r_m\\} row A=span{r1,r2,⋯,rm} 若两个矩阵 A A A 和 B B B 行等价,则它们的的行空间相同。若 B B B 是阶梯型矩阵,则 B B B 的非零行构成 row B \\text{row }B row B 的一组基,同时也是 row A \\text{row }A row A 的一组基。 证明:若 B B B 是由 A A A 经行变换得到的,则 B B B 的行是 A A A 的行的线性组合,于是 B B B 的行的任意线性组合自然是 A A A 的行的线性组合,从而 B B B 的行空间包含于 A A A 的行空间。因为行变换可逆,同理知 A A A 的行空间是 B B B 的行空间的子集,从而这两个空间相同。若 B B B 是一个阶梯形矩阵,则其非零行是线性无关的,这是因为任何一个非零行均不为它下面的非零行的线性组合,于是 B B B 的非零行构成 B B B 的行空间的一组基,当然也是 A A A 的行空间的一组基。 例:分别求矩阵 A A A 的行空间、列空间和零空间的基 A = \[ − 2 − 5 8 0 − 17 1 3 − 5 1 5 3 11 − 19 7 1 1 7 − 13 5 − 3 \] A=\\begin{bmatrix}-2\&-5\&8\&0\&-17\\\\1\&3\&-5\&1\&5\\\\3\&11\&-19\&7\&1\\\\1\&7\&-13\&5\&-3\\end{bmatrix} A= −2131−531178−5−19−130175−1751−3 解:为了求行空间和列空间的基,行化简 A A A成阶梯形 A → \[ 1 3 − 5 1 5 0 1 − 2 2 − 7 0 0 0 − 4 20 0 0 0 0 0 \] = B A\\to \\begin{bmatrix}1\&3\&-5\&1\&5\\\\0\&1\&-2\&2\&-7\\\\0\&0\&0\&-4\&20\\\\0\&0\&0\&0\&0\\end{bmatrix}=B A→ 10003100−5−20012−405−7200 =B 矩阵 B B B 的前 3 行构成 B B B的行空间的一个基,也是 A A A的行空间的一组基。 row A \\text{row }A row A 的基: ( 1 , 3 , − 5 , 1 , 5 ) , ( 0 , 1 , − 2 , 2 , − 7 ) , ( 0 , 0 , 0 , − 4 , 20 ) (1,3,-5,1,5),(0,1,-2,2,-7),(0,0,0,-4,20) (1,3,−5,1,5),(0,1,−2,2,−7),(0,0,0,−4,20) 对列空间, B B B 的主元列在第1,2和4列,从而 A A A 的第1,2和4列构成 col A \\text{col }A col A 的一组基。 col A \\text{col }A col A 的基: ( − 2 , 1 , 3 , 1 ) T , ( − 5 , 3 , 11 , 7 ) T , ( 0 , 1 , 7 , 5 ) T (-2,1,3,1)\^T,(-5,3,11,7)\^T,(0,1,7,5)\^T (−2,1,3,1)T,(−5,3,11,7)T,(0,1,7,5)T 对于核空间,需要进一步行变换得简化阶梯型矩阵 B → \[ 1 0 1 0 1 0 1 − 2 0 3 0 0 0 1 − 5 0 0 0 0 0 \] = C B\\to\\begin{bmatrix}1\&0\&1\&0\&1\\\\0\&1\&-2\&0\&3\\\\0\&0\&0\&1\&-5\\\\0\&0\&0\&0\&0\\end{bmatrix}=C B→ 100001001−200001013−50 =C 方程 A x = 0 A\\mathbf x=0 Ax=0 的解空间等价于 C x = 0 C\\mathbf x=0 Cx=0 的解空间,即 { x 1 + x 3 + x 5 = 0 x 2 − 2 x 3 + 3 x 5 = 0 x 4 − 5 x 5 = 0 \\begin{cases} x_1+x_3+x_5=0 \\\\ x_2-2x_3+3x_5=0 \\\\ x_4-5x_5=0 \\end{cases} ⎩ ⎨ ⎧x1+x3+x5=0x2−2x3+3x5=0x4−5x5=0 所以 \[ x 1 x 2 x 3 x 4 x 5 \] = x 3 \[ − 1 2 1 0 0 \] + x 5 \[ − 1 − 3 0 5 1 \] \\begin{bmatrix}x_1\\\\x_2\\\\x_3\\\\x_4\\\\x_5\\end{bmatrix}= x_3\\begin{bmatrix}-1\\\\2\\\\1\\\\0\\\\0\\end{bmatrix}+ x_5\\begin{bmatrix}-1\\\\-3\\\\0\\\\5\\\\1\\end{bmatrix} x1x2x3x4x5 =x3 −12100 +x5 −1−3051 ker ⁡ A \\ker A kerA 的基: ( − 1 , 2 , 1 , 0 , 0 ) T , ( − 1 , − 3 , 0 , 5 , 1 ) T (-1,2,1,0,0)\^T,(-1,-3,0,5,1)\^T (−1,2,1,0,0)T,(−1,−3,0,5,1)T 通过观察可见,与 col A \\text{col }A col A 的基不同, row A \\text{row }A row A 和 ker ⁡ A \\ker A kerA 的基与 A A A 中的元素没有直接的关系。 定理:对于 m × n m\\times n m×n 维矩阵 A A A 1. dim ⁡ ( row A ) = dim ⁡ ( col A ) = rank A \\dim(\\text{row }A)=\\dim(\\text{col }A)=\\text{rank }A dim(row A)=dim(col A)=rank A 2. rank A + dim ⁡ ( ker ⁡ A ) = n \\text{rank }A+\\dim(\\ker A)=n rank A+dim(kerA)=n 证明: rank A \\text{rank }A rank A 是 A A A中主元列的个数,也是 A A A的等价阶梯形矩阵 B B B中主元列的个数。进一步,因为 B B B 的每个主元都对应一个非零行,同时这些非零行构成 A A A 的行空间的一组基,所以 A A A 的秩等于 row A \\text{row }A row A 的维数。由于 ker ⁡ A \\ker A kerA 的维数等于方程 A x = 0 A\\mathbf x=0 Ax=0 中自由变量的个数,换句话说, ker ⁡ A \\ker A kerA 的维数是 A A A 中非主元列的个数。上面的定理证闭。 性质: 1. 矩阵的秩在初等变换下保持不变 2. 矩阵的列向量组的秩等于行向量组的秩 3. rank ( A + B ) ⩽ rank ( A ) + rank ( B ) \\text{rank}(A+B)\\leqslant \\text{rank}(A)+\\text{rank}(B) rank(A+B)⩽rank(A)+rank(B) 4. rank ( k A ) = rank ( A ) \\text{rank}(kA)=\\text{rank}(A) rank(kA)=rank(A) 5. rank ( A B ) ⩽ min ⁡ { rank ( A ) , rank ( B ) } \\text{rank}(AB)\\leqslant \\min\\{\\text{rank}(A),\\text{rank}(B)\\} rank(AB)⩽min{rank(A),rank(B)} ## 广义逆矩阵 对于非其次线性方程组 A x = b A\\mathbf x=\\mathbf b Ax=b ,当 A A A 可逆时,则方程组存在唯一解 x = A − 1 b \\mathbf x=A\^{-1}\\mathbf b x=A−1b,通常矩阵 A A A 是任意的 m × n m\\times n m×n 矩阵,不可逆的,这就促使人们去推广逆矩阵的概念,引进某种具有普通逆矩阵类似性质的矩阵 G G G,使得方程组的解仍可表示为 x = G b \\mathbf x=G\\mathbf b x=Gb 这种简单的形式。 * 若 A G A = A AGA=A AGA=A,则 A x = A G A x = A ( G b ) = b A\\mathbf x=AGA\\mathbf x=A(G\\mathbf b)=\\mathbf b Ax=AGAx=A(Gb)=b,于是 G b G\\mathbf b Gb 是方程的解; * 若 G A G = G GAG=G GAG=G,由于 G A x = G b GA\\mathbf x=G\\mathbf b GAx=Gb,所以 G A x = G A G A x = G A ( G b ) = G b GA\\mathbf x=GAGA\\mathbf x=GA(G\\mathbf b)=G\\mathbf b GAx=GAGAx=GA(Gb)=Gb,于是 G b G\\mathbf b Gb 是方程的解; 对于 m × n m\\times n m×n 维矩阵 A A A,若存在 n × m n\\times m n×m 维矩阵 G G G 满足以下 M-P 方程 (1) A G A = A AGA=A AGA=A (2) G A G = G GAG=G GAG=G (3) ( A G ) T = A G (AG)\^T=AG (AG)T=AG (4) ( G A ) T = G A (GA)\^T=GA (GA)T=GA 的全部或一部分,则称 G G G 为 A A A 的一个**广义逆矩阵** 。若 G G G 满足全部 M-P 方程,则称 G G G 为 A A A 的 Moore-Penrose 广义逆矩阵,简称M-P 广义逆矩阵,也称为伪逆矩阵,记为 A + A\^+ A+。事实上,只有伪逆矩阵存在且唯一,其他各类广义逆矩阵都不唯一。 性质: 1. ( A + ) + = A (A\^+)\^+=A (A+)+=A 2. ( A T ) + = ( A + ) T (A\^T)\^+=(A\^+)\^T (AT)+=(A+)T 3. rank A + = rank A \\text{rank }A\^+=\\text{rank }A rank A+=rank A 若非其次线性方程组 A x = b A\\mathbf x=\\mathbf b Ax=b 有解,则解为 x = A + b + ( I − A + A ) c \\mathbf x=A\^+\\mathbf b+(I-A\^+A)\\mathbf c x=A+b+(I−A+A)c 其中 c \\mathbf c c 是维数与 x \\mathbf x x 的维数相同的任意向量。显然,当 A A A 可逆时, x = A − 1 b + ( I − A − 1 A ) c = A − 1 b \\mathbf x=A\^{-1}\\mathbf b+(I-A\^{-1}A)\\mathbf c=A\^{-1}\\mathbf b x=A−1b+(I−A−1A)c=A−1b 。 求伪逆矩阵的一个方法是利用奇异值分解 A = U Σ V T A=U\\Sigma V\^T A=UΣVT 。由于 Λ r \\Lambda_r Λr 的对角线元素非零,所以 Λ r \\Lambda_r Λr 可逆,可求得伪逆为 A + = V r Λ r − 1 U r T A\^+=V_r\\Lambda_r\^{-1} U\^T_r A+=VrΛr−1UrT

相关推荐
岁忧9 小时前
(LeetCode 每日一题) 498. 对角线遍历 (矩阵、模拟)
java·c++·算法·leetcode·矩阵·go
人机与认知实验室12 小时前
人机环境空战矩阵
人工智能·线性代数·算法·机器学习·矩阵
无风听海19 小时前
线性代数之深入理解旋转矩阵
线性代数·机器学习·矩阵·旋转矩阵
时空无限2 天前
大模型知识点之矩阵乘以向量
线性代数·语言模型·矩阵
时空无限2 天前
为什么矩阵乘以向量要求矩阵列数等于向量维度
机器学习·语言模型·矩阵
构建的乐趣2 天前
矩阵微积分的链式法则(chain rule)
线性代数·机器学习·矩阵
汤姆爱耗儿药2 天前
矩阵初等变换的几何含义
线性代数·矩阵
天选之女wow2 天前
【LeetCode】动态规划——542.01 矩阵
leetcode·矩阵·动态规划
小星星爱分享3 天前
抖音多账号运营新范式:巨推AI如何解锁流量矩阵的商业密码
人工智能·线性代数·矩阵
和花折月丶3 天前
Visual Studio 2022调试Eigen库查看矩阵与向量的值
矩阵·visual studio·eigen库