文章目录
矩阵的运算
矩阵的转置
转置 :矩阵 A A A的行列互换得到的矩阵称为 A A A 的转置(transpose),记作 A T A^T AT。
性质:矩阵转置运算满足下列性质:
- ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
- ( A T ) T = A (A^T)^T=A (AT)T=A
- ( k A ) T = k A T (kA)^T=kA^T (kA)T=kAT
- ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT
- ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T
方阵的运算
三角矩阵 :(triangular matrix)主对角线的下方元素都是零的方阵,称为上三角矩阵 。类似的,主对角线的上方元素都是零的方阵,称为下三角矩阵 。
a 11 a 12 ⋯ a 1 n a 22 ⋯ a 2 n ⋱ ⋮ a n n \] , \[ a 11 a 21 a 22 ⋮ ⋮ ⋱ a n 1 a n 2 ⋯ a n n \] \\begin{bmatrix} a_{11}\&a_{12}\&\\cdots\&a_{1n} \\\\ \&a_{22}\&\\cdots\&a_{2n} \\\\ \&\&\\ddots\&\\vdots \\\\ \&\&\&a_{nn} \\\\ \\end{bmatrix},\\quad \\begin{bmatrix} a_{11}\&\&\& \\\\ a_{21}\&a_{22}\&\& \\\\ \\vdots\&\\vdots\&\\ddots\& \\\\ a_{n1}\&a_{n2}\&\\cdots\&a_{nn} \\\\ \\end{bmatrix} a11a12a22⋯⋯⋱a1na2n⋮ann , a11a21⋮an1a22⋮an2⋱⋯ann **上(下)三角阵的行列式为主对角线元素的乘积** det A = a 11 a 22 ⋯ a n n \\det A=a_{11}a_{22}\\cdots a_{nn} detA=a11a22⋯ann **对角阵** :不在主对角线上的元素全为零的矩阵称为**对角阵** (diagonal matrix),记作 d i a g ( a 1 , a 2 , ⋯ , a n ) = \[ a 1 a 2 ⋱ a n \] \\mathrm{diag}(a_1,a_2,\\cdots,a_n)=\\begin{bmatrix} a_1 \\\\ \&a_2 \\\\ \&\&\\ddots \\\\ \&\&\&a_n \\\\ \\end{bmatrix} diag(a1,a2,⋯,an)= a1a2⋱an 对角阵有良好的性质: 1. 两对角阵的乘积仍为对角阵 \[ a 1 a 2 ⋱ a n \] \[ b 1 b 2 ⋱ b n \] = \[ a 1 b 1 a 2 b 2 ⋱ a n b n \] \\begin{bmatrix}a_1 \\\\\&a_2 \\\\\&\&\\ddots \\\\\&\&\&a_n \\end{bmatrix} \\begin{bmatrix}b_1 \\\\\&b_2 \\\\\&\&\\ddots \\\\\&\&\&b_n \\end{bmatrix}= \\begin{bmatrix}a_1b_1 \\\\\&a_2b_2 \\\\\&\&\\ddots \\\\\&\&\&a_nb_n \\end{bmatrix} a1a2⋱an b1b2⋱bn = a1b1a2b2⋱anbn 2. 对角阵的幂仍为对角阵 \[ a 1 a 2 ⋱ a n \] k = \[ a 1 k a 2 k ⋱ a n k \] \\begin{bmatrix}a_1 \\\\\&a_2 \\\\\&\&\\ddots \\\\\&\&\&a_n \\end{bmatrix}\^k= \\begin{bmatrix}a_1\^k \\\\\&a_2\^k \\\\\&\&\\ddots \\\\\&\&\&a_n\^k \\end{bmatrix} a1a2⋱an k= a1ka2k⋱ank **数量阵** :主对角线上的元素都相等的对角阵,称为**数量阵** (scalar matrix)。 d i a g ( a , a , ⋯ , a ) = \[ a a ⋱ a \] \\mathrm{diag}(a,a,\\cdots,a)=\\begin{bmatrix} a \\\\ \&a \\\\ \&\&\\ddots \\\\ \&\&\&a \\\\ \\end{bmatrix} diag(a,a,⋯,a)= aa⋱a 数量阵得名于它的乘法。如二阶数量阵 \[ k 0 0 k \] A = k \[ 1 0 0 1 \] A = k A \\begin{bmatrix}k\&0 \\\\ 0\&k \\end{bmatrix}A=k\\begin{bmatrix}1\&0 \\\\ 0\&1 \\end{bmatrix}A=kA \[k00k\]A=k\[1001\]A=kA **单位阵** :主对角线上的元素全为1的对角阵,称为**单位阵** (identity matrix)。 n n n 阶单位阵记作 E n E_n En或 I n I_n In。任何矩阵与单位阵的乘积都等于自身。 I 3 = \[ 1 0 0 0 1 0 0 0 1 \] I_3=\\begin{bmatrix}1\&0\&0 \\\\0\&1\&0 \\\\0\&0\&1 \\\\ \\end{bmatrix} I3= 100010001 **对称阵** 与**反对称阵** :设 A = ( a i j ) A=(a_{ij}) A=(aij) 为 n n n阶方阵,若 A T = A A\^T=A AT=A ,即 a i j = a j i a_{ij}=a_{ji} aij=aji,则称为**对称阵** (symmetric matrix);若 A T = − A A\^T=-A AT=−A ,即 a i j = − a j i a_{ij}=-a_{ji} aij=−aji,则称为**反对称阵**(skew-symmetric matrix)。 易证明 A A T AA\^T AAT 和 A T A A\^TA ATA 是对称阵。 **方阵的幂** :由于矩阵满足结合律,我们可以定义矩阵的幂运算 A 0 = I , A n = A A ⋯ A ⏞ n A\^0=I,\\quad A\^n=\\overbrace{AA\\cdots A}\^n A0=I,An=AA⋯A n 当矩阵 A A A 可逆时,定义 A − k = ( A − 1 ) k A\^{-k}=(A\^{-1})\^k A−k=(A−1)k 显然只有方阵的幂才有意义。幂运算满足如下性质: 1. A k A l = A k + l A\^kA\^l=A\^{k+l} AkAl=Ak+l 2. ( A k ) l = A k l (A\^k)\^l=A\^{kl} (Ak)l=Akl 注意:因为矩阵乘法无交换率,因此一般情况下 ( A B ) k ≠ A k B k (AB)\^k\\neq A\^kB\^k (AB)k=AkBk ## 初等矩阵 **初等变换** :矩阵初等行变换的定义同样适用于列,相应的记法为 c i ↔ c j , k c i , c i + k c j c_i\\lrarr c_j,kc_i,c_i+kc_j ci↔cj,kci,ci+kcj 。矩阵的初等行变换和初等列变换统称矩阵的**初等变换** 。若矩阵 A A A 经有限次初等变换变为 B B B,则称 A A A与 B B B **等价**(equivalent) 。 矩阵的初等变换是矩阵的一种最基本运算,其过程可以通过特殊矩阵的乘法来表示。 初等矩阵:由单位矩阵进行一次初等变换得到的矩阵称为**初等矩阵**(elementary matrix)。易知初等矩阵都是可逆的。 三种初等变换对应着三种初等矩阵。由矩阵的乘法运算可以验证:**对矩阵的初等行变换相当于左乘相应的初等矩阵;对矩阵的初等列变换相当于右乘相应的初等矩阵**。 1. 互换变换,如 r 1 ↔ r 2 r_1\\lrarr r_2 r1↔r2 \[ 0 1 0 1 0 0 0 0 1 \] \[ a 1 b 1 a 2 b 2 a 3 b 3 \] = \[ a 2 b 2 a 1 b 1 a 3 b 3 \] \\begin{bmatrix}0\&1\&0 \\\\1\&0\&0\\\\0\&0\&1\\end{bmatrix} \\begin{bmatrix}a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix}= \\begin{bmatrix}a_2\&b_2\\\\a_1\&b_1 \\\\a_3\&b_3\\end{bmatrix} 010100001 a1a2a3b1b2b3 = a2a1a3b2b1b3 2. 倍乘变换,如 2 r 1 2r_1 2r1 \[ 2 0 0 0 1 0 0 0 1 \] \[ a 1 b 1 a 2 b 2 a 3 b 3 \] = \[ 2 a 1 b 1 a 2 b 2 a 3 b 3 \] \\begin{bmatrix}2\&0\&0 \\\\0\&1\&0\\\\0\&0\&1\\end{bmatrix} \\begin{bmatrix}a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix}= \\begin{bmatrix}2a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix} 200010001 a1a2a3b1b2b3 = 2a1a2a3b1b2b3 3. 倍加变换,如 r 1 + 2 r 2 r_1+2r_2 r1+2r2 \[ 1 2 0 0 1 0 0 0 1 \] \[ a 1 b 1 a 2 b 2 a 3 b 3 \] = \[ a 1 + 2 a 2 b 1 + 2 b 2 a 2 b 2 a 3 b 3 \] \\begin{bmatrix}1\&2\&0 \\\\0\&1\&0\\\\0\&0\&1\\end{bmatrix} \\begin{bmatrix}a_1\&b_1 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix}= \\begin{bmatrix}a_1+2a_2\&b_1+2b_2 \\\\a_2\&b_2\\\\a_3\&b_3\\end{bmatrix} 100210001 a1a2a3b1b2b3 = a1+2a2a2a3b1+2b2b2b3 定理:任意一个可逆矩阵都可以表示为有限个初等矩阵的乘积。 由于初等矩阵可逆,所以初等矩阵的乘积亦可逆。 所有矩阵都可通过初等变换化为**标准型** \[ 1 ⋱ 1 } r 0 ⋱ 0 \] = \[ I r O O O \] \\begin{bmatrix} \\left.\\begin{matrix}1\&\& \\\\ \&\\ddots\&\\\\\&\&1\\end{matrix}\\right\\}r \& \\\\ \&\\begin{matrix}0 \\\\ \&\\ddots\&\\\\\&\&0\\end{matrix} \\end{bmatrix}= \\begin{bmatrix}I_r\&O \\\\O\&O\\end{bmatrix} 1⋱1⎭ ⎬ ⎫r0⋱0 =\[IrOOO
分块矩阵
分块矩阵是矩阵运算的一种技巧。
在矩阵的运算和理论研究中,有时对矩阵进行分块处理,常常会简化矩阵的运算,或者使原矩阵显得结构简单而清晰。
1 0 0 0 0 1 0 0 0 0 1 5 \] = \[ I 2 O O A \] \\begin{bmatrix} \\begin{array}{cc:cc} 1\&0 \& 0 \& 0 \\\\ 0\&1 \& 0 \&0 \\\\ \\hdashline 0\&0 \& 1 \& 5 \\end{array}\\end{bmatrix} =\\begin{bmatrix} I_2 \& O \\\\ O \& A \\end{bmatrix} 100010001005 =\[I2OOA
像这样,结合矩阵本身的特点,把一个矩阵用横线和竖线划分为若干个子块,并以所分的子块为元素的矩阵称为分块矩阵(Block matrix)。一个矩阵可用不同的方法分块。
分块矩阵的运算形式上和普通矩阵相同,把子块当成元素计算即可。
加法 :设分块 A , B A,B A,B 是同型矩阵,且对它们的分法相同,则 A + B = ( A i j + B i j ) A+B=(A_{ij}+B_{ij}) A+B=(Aij+Bij)
A 1 B 1 C 1 D 1 \] + \[ A 2 B 2 C 2 D 2 \] = \[ A 1 + A 2 B 1 + B 2 C 1 + C 2 D 1 + D 2 \] \\begin{bmatrix}A_1 \& B_1 \\\\C_1 \& D_1 \\end{bmatrix}+ \\begin{bmatrix}A_2 \& B_2 \\\\C_2 \& D_2 \\end{bmatrix}=\\begin{bmatrix}A_1+A_2 \& B_1+B_2 \\\\C_1+C_2 \& D_1+D_2 \\end{bmatrix} \[A1C1B1D1\]+\[A2C2B2D2\]=\[A1+A2C1+C2B1+B2D1+D2
数乘 :分块矩阵 A A A ,数乘作用于每个子块。
k [ A B C D ] = [ k A k B k C k D ] k\begin{bmatrix}A & B \\C & D \end{bmatrix}=\begin{bmatrix}kA & kB \\kC & kD \end{bmatrix} k[ACBD]=[kAkCkBkD]
乘法 :分块矩阵的乘法按矩阵乘法的形式计算。
A B = A [ b 1 b 2 ⋯ b p ] = [ A b 1 A b 2 ⋯ A b p ] AB=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_p\end{bmatrix}= \begin{bmatrix}A\mathbf b_1&A\mathbf b_2&\cdots&A\mathbf b_p\end{bmatrix} AB=A[b1b2⋯bp]=[Ab1Ab2⋯Abp]
矩阵乘法的列行展开
A B = [ a 1 a 2 ⋯ a n ] [ b 1 b 2 ⋮ b n ] = a 1 b 1 + a 2 b 2 + ⋯ + a n b n AB=\begin{bmatrix}\mathbf a_1&\mathbf a_2&\cdots&\mathbf a_n\end{bmatrix} \begin{bmatrix}\mathbf b_1\\\mathbf b_2\\\vdots\\\mathbf b_n\end{bmatrix} =\mathbf a_1\mathbf b_1+\mathbf a_2\mathbf b_2+\cdots+\mathbf a_n\mathbf b_n AB=[a1a2⋯an] b1b2⋮bn =a1b1+a2b2+⋯+anbn
转置 :分块矩阵 A = ( A i j ) A=(A_{ij}) A=(Aij) 的转置等于各子块的转置 A T = ( A i j T ) A^T=(A_{ij}^T) AT=(AijT)
分块上三角矩阵 :
A B O D \] − 1 = \[ A − 1 − A − 1 B D − 1 O D − 1 \] \\begin{bmatrix}A\&B\\\\O\&D\\end{bmatrix}\^{-1}= \\begin{bmatrix}A\^{-1}\&-A\^{-1}BD\^{-1}\\\\O\&D\^{-1}\\end{bmatrix} \[AOBD\]−1=\[A−1O−A−1BD−1D−1
设分块矩阵 [ X 1 X 2 X 3 X 4 ] \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} [X1X3X2X4] 是矩阵 [ A B O D ] \begin{bmatrix}A&B\\O&D\end{bmatrix} [AOBD] 的逆,则
A B O D \] \[ X 1 X 2 X 3 X 4 \] = \[ I p O O I q \] \\begin{bmatrix}A\&B\\\\O\&D\\end{bmatrix} \\begin{bmatrix}X_1\&X_2\\\\X_3\&X_4\\end{bmatrix} =\\begin{bmatrix}I_p\&O\\\\O\&I_q\\end{bmatrix} \[AOBD\]\[X1X3X2X4\]=\[IpOOIq
这个矩阵方程包含了4个未知子块的方程
A X 1 + B X 3 = I p A X 2 + B X 4 = O D X 3 = O D X 4 = I q AX_1+BX_3=I_p \\ AX_2+BX_4=O \\ DX_3=O \\ DX_4=I_q AX1+BX3=IpAX2+BX4=ODX3=ODX4=Iq
若 D D D 可逆,从后两个方程可以得到 X 3 = O , X 4 = D − 1 X_3=O,X_4=D^{-1} X3=O,X4=D−1 ;若 A A A 可逆,进一步可以得到 X 1 = A − 1 , X 2 = − A − 1 B D − 1 X_1=A^{-1},X_2=-A^{-1}BD^{-1} X1=A−1,X2=−A−1BD−1 。便可获得分块上三角矩阵的逆。
分块对角矩阵:分块对角矩阵拥有良好的性质。
(1) 分块对角矩阵乘积
A 1 A 2 ⋱ A s \] \[ B 1 B 2 ⋱ B s \] = \[ A 1 B 1 A 2 B 2 ⋱ A s B s \] \\begin{bmatrix}A_1 \\\\\&A_2 \\\\\&\&\\ddots \\\\\&\&\&A_s \\end{bmatrix} \\begin{bmatrix}B_1 \\\\\&B_2 \\\\\&\&\\ddots \\\\\&\&\&B_s \\end{bmatrix} =\\begin{bmatrix}A_1B_1 \\\\\&A_2B_2 \\\\\&\&\\ddots \\\\\&\&\&A_sB_s \\end{bmatrix} A1A2⋱As B1B2⋱Bs = A1B1A2B2⋱AsBs (2) 若分块对角矩阵的各个子块可逆,则该对角分块矩阵可逆 \[ A 1 A 2 ⋱ A s \] − 1 = \[ A 1 − 1 A 2 − 1 ⋱ A s − 1 \] \\begin{bmatrix}A_1 \\\\\&A_2 \\\\\&\&\\ddots \\\\\&\&\&A_s \\end{bmatrix}\^{-1}= \\begin{bmatrix}A_1\^{-1} \\\\\&A_2\^{-1} \\\\\&\&\\ddots \\\\\&\&\&A_s\^{-1} \\end{bmatrix} A1A2⋱As −1= A1−1A2−1⋱As−1 (3) 分块对角矩阵的行列式为对角位置的行列式乘积 det \[ A 1 A 2 ⋱ A s \] = det A 1 det A 2 ⋯ det A s \\det\\begin{bmatrix}A_1 \\\\\&A_2 \\\\\&\&\\ddots \\\\\&\&\&A_s \\end{bmatrix} =\\det A_1\\det A_2\\cdots\\det A_s det A1A2⋱As =detA1detA2⋯detAs ## 逆矩阵 利用克拉默法可以容易地导出一个求矩阵的逆的一般公式。设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\\times n} A=(aij)n×n 的逆矩阵 A − 1 = ( b i j ) n × n A\^{-1}=(b_{ij})_{n\\times n} A−1=(bij)n×n ,利用分块矩阵的乘法 A A − 1 = A \[ b 1 b 2 ⋯ b n \] = I n = \[ e 1 e 2 ⋯ e n \] AA\^{-1}=A\\begin{bmatrix}\\mathbf b_1\&\\mathbf b_2\&\\cdots\&\\mathbf b_n\\end{bmatrix} =I_n=\\begin{bmatrix}\\mathbf e_1\&\\mathbf e_2\&\\cdots\&\\mathbf e_n\\end{bmatrix} AA−1=A\[b1b2⋯bn\]=In=\[e1e2⋯en
其中 b j \mathbf b_j bj 是矩阵 A − 1 A^{-1} A−1 的第 j j j 列, e j \mathbf e_j ej 是单位阵 I n I_n In 的第 j j j 列。于是
A b j = e j A\mathbf b_j=\mathbf e_j Abj=ej
向量 b j \mathbf b_j bj 的第 i i i 个元素是 A − 1 A^{-1} A−1 的元素 b i j b_{ij} bij 。由克拉默法则求得
b i j = det A i ( e j ) det A b_{ij}=\frac{\det A_i(\mathbf e_j)}{\det A} bij=detAdetAi(ej)
回顾代数余子式的定义,它是把矩阵 A A A 中元素 a i j a_{ij} aij 所在的行和列划掉后得到的。 det A i ( e j ) \det A_i(\mathbf e_j) detAi(ej) 按第 i i i 列的余子展开式为
det A i ( e j ) = ( − 1 ) i + j M j i = A j i \det A_i(\mathbf e_j)=(-1)^{i+j}M_{ji}=A_{ji} detAi(ej)=(−1)i+jMji=Aji
于是可写出矩阵 A A A 的逆
A − 1 = 1 det A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A
其中 adj A \text{adj }A adj A 是矩阵 A A A 的各个元素的代数余子式 A j i A_{ji} Aji 所构成的矩阵
adj A = [ A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ] \text{adj }A=\begin{bmatrix} A_{11}&A_{21}&\cdots&A_{n1} \\ A_{12}&A_{22}&\cdots&A_{n2} \\ \vdots&\vdots&\ddots&\vdots \\ A_{1n}&A_{2n}&\cdots&A_{nn} \\ \end{bmatrix} adj A= A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann
做矩阵 A A A的伴随矩阵(Adjugate Matrix) 。
注意,伴随矩阵里代数余子式的排列顺序是颠倒的。
定理:方阵 A A A 可逆的充要条件是 det A ≠ 0 \det A\neq0 detA=0 ,且 A − 1 = 1 det A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A
此定理仅适用于理论上的计算矩阵的逆,使我们不用实际计算出 A − 1 A^{-1} A−1 就可以推导出性质。
这里给出二阶方阵 A = [ a b c d ] A=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆,若 det A = a d − b c ≠ 0 \det A=ad-bc\neq0 detA=ad−bc=0 则
A − 1 = 1 a d − b c [ d − b − c a ] A^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=ad−bc1[d−c−ba]
推论:
- 若 n n n 阶方阵 A , B A,B A,B 满足 A B = I AB=I AB=I 或 B A = I BA=I BA=I ,则 B = A − 1 B=A^{-1} B=A−1 。
- A ( adj A ) = ( adj A ) A = ( det A ) I A(\text{adj }A)=(\text{adj }A)A=(\det A)I A(adj A)=(adj A)A=(detA)I
有了推论1,只需判断 A B = I AB=I AB=I 或 B A = I BA=I BA=I 中的一个条件就可判定逆矩阵,要比定义简单一些。
利用初等变换计算逆矩阵 :写出增广矩阵 ( A ∣ I ) (A\mid I) (A∣I), 用初等行变换把左边矩阵 A A A 处化为单位矩阵 I I I ,则右边出来的就是逆矩阵 A − 1 A^{-1} A−1,示意如下:
( A ∣ I ) → ( I ∣ A − 1 ) (A\mid I)\xrightarrow{}(I\mid A^{-1}) (A∣I) (I∣A−1)
同样,利用初等列变换计算逆矩阵的示意如下
A I \] → \[ I A − 1 \] \\begin{bmatrix}A\\\\I\\end{bmatrix}\\xrightarrow{}\\begin{bmatrix}I\\\\A\^{-1}\\end{bmatrix} \[AI\] \[IA−1
示例:解矩阵方程
1 0 1 − 1 1 1 2 − 1 1 \] \[ x 1 y 1 x 2 y 2 x 3 y 3 \] = \[ 1 1 0 1 − 1 0 \] \\begin{bmatrix}1\&0\&1\\\\-1\&1\&1\\\\2\&-1\&1\\end{bmatrix} \\begin{bmatrix}x_1\&y_1\\\\x_2\&y_2\\\\x_3\&y_3\\\\\\end{bmatrix}= \\begin{bmatrix}1\&1\\\\0\&1\\\\-1\&0\\\\\\end{bmatrix} 1−1201−1111 x1x2x3y1y2y3 = 10−1110 解:系数矩阵可逆的矩阵方程 A X = B AX=B AX=B ,解为 X = A − 1 B X=A\^{-1}B X=A−1B 。实际中,不必求逆矩阵,可使用一系列初等变换求解,即系数矩阵和常数项做同样的变换 P = A − 1 P=A\^{-1} P=A−1。图示如下 ( A ∣ B ) → ( I ∣ X ) (A\\mid B)\\xrightarrow{}(I\\mid X) (A∣B) (I∣X) 本例计算过程如下 \[ 1 0 1 1 1 − 1 1 1 0 1 2 − 1 1 − 1 0 \] → \[ 1 0 0 3 1 0 1 0 5 2 0 0 1 − 2 0 \] \\begin{bmatrix} \\begin{array}{ccc:cc} 1\&0\&1\&1\&1\\\\ -1\&1\&1\&0\&1\\\\ 2\&-1\&1\&-1\&0 \\end{array} \\end{bmatrix}\\to \\begin{bmatrix} \\begin{array}{ccc:cc} 1\&0\&0\&3\&1\\\\ 0\&1\&0\&5\&2\\\\ 0\&0\&1\&-2\&0 \\end{array} \\end{bmatrix} 1−1201−111110−1110 → 10001000135−2120 故 \[ x 1 y 1 x 2 y 2 x 3 y 3 \] = \[ 3 1 5 2 − 2 0 \] \\begin{bmatrix}x_1\&y_1\\\\x_2\&y_2\\\\x_3\&y_3\\end{bmatrix}= \\begin{bmatrix}3\&1\\\\5\&2\\\\-2\&0\\end{bmatrix} x1x2x3y1y2y3 = 35−2120 ## 矩阵的秩 **行空间** :矩阵 A = ( r 1 , r 2 , ⋯ , r m ) T A=(\\mathbf r_1,\\mathbf r_2,\\cdots,\\mathbf r_m)\^T A=(r1,r2,⋯,rm)T 的所有行向量张成的空间称为 A A A 的行空间,记为 row A = span { r 1 , r 2 , ⋯ , r m } \\text{row }A=\\text{span}\\{\\mathbf r_1,\\mathbf r_2,\\cdots,\\mathbf r_m\\} row A=span{r1,r2,⋯,rm} 若两个矩阵 A A A 和 B B B 行等价,则它们的的行空间相同。若 B B B 是阶梯型矩阵,则 B B B 的非零行构成 row B \\text{row }B row B 的一组基,同时也是 row A \\text{row }A row A 的一组基。 证明:若 B B B 是由 A A A 经行变换得到的,则 B B B 的行是 A A A 的行的线性组合,于是 B B B 的行的任意线性组合自然是 A A A 的行的线性组合,从而 B B B 的行空间包含于 A A A 的行空间。因为行变换可逆,同理知 A A A 的行空间是 B B B 的行空间的子集,从而这两个空间相同。若 B B B 是一个阶梯形矩阵,则其非零行是线性无关的,这是因为任何一个非零行均不为它下面的非零行的线性组合,于是 B B B 的非零行构成 B B B 的行空间的一组基,当然也是 A A A 的行空间的一组基。 例:分别求矩阵 A A A 的行空间、列空间和零空间的基 A = \[ − 2 − 5 8 0 − 17 1 3 − 5 1 5 3 11 − 19 7 1 1 7 − 13 5 − 3 \] A=\\begin{bmatrix}-2\&-5\&8\&0\&-17\\\\1\&3\&-5\&1\&5\\\\3\&11\&-19\&7\&1\\\\1\&7\&-13\&5\&-3\\end{bmatrix} A= −2131−531178−5−19−130175−1751−3 解:为了求行空间和列空间的基,行化简 A A A成阶梯形 A → \[ 1 3 − 5 1 5 0 1 − 2 2 − 7 0 0 0 − 4 20 0 0 0 0 0 \] = B A\\to \\begin{bmatrix}1\&3\&-5\&1\&5\\\\0\&1\&-2\&2\&-7\\\\0\&0\&0\&-4\&20\\\\0\&0\&0\&0\&0\\end{bmatrix}=B A→ 10003100−5−20012−405−7200 =B 矩阵 B B B 的前 3 行构成 B B B的行空间的一个基,也是 A A A的行空间的一组基。 row A \\text{row }A row A 的基: ( 1 , 3 , − 5 , 1 , 5 ) , ( 0 , 1 , − 2 , 2 , − 7 ) , ( 0 , 0 , 0 , − 4 , 20 ) (1,3,-5,1,5),(0,1,-2,2,-7),(0,0,0,-4,20) (1,3,−5,1,5),(0,1,−2,2,−7),(0,0,0,−4,20) 对列空间, B B B 的主元列在第1,2和4列,从而 A A A 的第1,2和4列构成 col A \\text{col }A col A 的一组基。 col A \\text{col }A col A 的基: ( − 2 , 1 , 3 , 1 ) T , ( − 5 , 3 , 11 , 7 ) T , ( 0 , 1 , 7 , 5 ) T (-2,1,3,1)\^T,(-5,3,11,7)\^T,(0,1,7,5)\^T (−2,1,3,1)T,(−5,3,11,7)T,(0,1,7,5)T 对于核空间,需要进一步行变换得简化阶梯型矩阵 B → \[ 1 0 1 0 1 0 1 − 2 0 3 0 0 0 1 − 5 0 0 0 0 0 \] = C B\\to\\begin{bmatrix}1\&0\&1\&0\&1\\\\0\&1\&-2\&0\&3\\\\0\&0\&0\&1\&-5\\\\0\&0\&0\&0\&0\\end{bmatrix}=C B→ 100001001−200001013−50 =C 方程 A x = 0 A\\mathbf x=0 Ax=0 的解空间等价于 C x = 0 C\\mathbf x=0 Cx=0 的解空间,即 { x 1 + x 3 + x 5 = 0 x 2 − 2 x 3 + 3 x 5 = 0 x 4 − 5 x 5 = 0 \\begin{cases} x_1+x_3+x_5=0 \\\\ x_2-2x_3+3x_5=0 \\\\ x_4-5x_5=0 \\end{cases} ⎩ ⎨ ⎧x1+x3+x5=0x2−2x3+3x5=0x4−5x5=0 所以 \[ x 1 x 2 x 3 x 4 x 5 \] = x 3 \[ − 1 2 1 0 0 \] + x 5 \[ − 1 − 3 0 5 1 \] \\begin{bmatrix}x_1\\\\x_2\\\\x_3\\\\x_4\\\\x_5\\end{bmatrix}= x_3\\begin{bmatrix}-1\\\\2\\\\1\\\\0\\\\0\\end{bmatrix}+ x_5\\begin{bmatrix}-1\\\\-3\\\\0\\\\5\\\\1\\end{bmatrix} x1x2x3x4x5 =x3 −12100 +x5 −1−3051 ker A \\ker A kerA 的基: ( − 1 , 2 , 1 , 0 , 0 ) T , ( − 1 , − 3 , 0 , 5 , 1 ) T (-1,2,1,0,0)\^T,(-1,-3,0,5,1)\^T (−1,2,1,0,0)T,(−1,−3,0,5,1)T 通过观察可见,与 col A \\text{col }A col A 的基不同, row A \\text{row }A row A 和 ker A \\ker A kerA 的基与 A A A 中的元素没有直接的关系。 定理:对于 m × n m\\times n m×n 维矩阵 A A A 1. dim ( row A ) = dim ( col A ) = rank A \\dim(\\text{row }A)=\\dim(\\text{col }A)=\\text{rank }A dim(row A)=dim(col A)=rank A 2. rank A + dim ( ker A ) = n \\text{rank }A+\\dim(\\ker A)=n rank A+dim(kerA)=n 证明: rank A \\text{rank }A rank A 是 A A A中主元列的个数,也是 A A A的等价阶梯形矩阵 B B B中主元列的个数。进一步,因为 B B B 的每个主元都对应一个非零行,同时这些非零行构成 A A A 的行空间的一组基,所以 A A A 的秩等于 row A \\text{row }A row A 的维数。由于 ker A \\ker A kerA 的维数等于方程 A x = 0 A\\mathbf x=0 Ax=0 中自由变量的个数,换句话说, ker A \\ker A kerA 的维数是 A A A 中非主元列的个数。上面的定理证闭。 性质: 1. 矩阵的秩在初等变换下保持不变 2. 矩阵的列向量组的秩等于行向量组的秩 3. rank ( A + B ) ⩽ rank ( A ) + rank ( B ) \\text{rank}(A+B)\\leqslant \\text{rank}(A)+\\text{rank}(B) rank(A+B)⩽rank(A)+rank(B) 4. rank ( k A ) = rank ( A ) \\text{rank}(kA)=\\text{rank}(A) rank(kA)=rank(A) 5. rank ( A B ) ⩽ min { rank ( A ) , rank ( B ) } \\text{rank}(AB)\\leqslant \\min\\{\\text{rank}(A),\\text{rank}(B)\\} rank(AB)⩽min{rank(A),rank(B)} ## 广义逆矩阵 对于非其次线性方程组 A x = b A\\mathbf x=\\mathbf b Ax=b ,当 A A A 可逆时,则方程组存在唯一解 x = A − 1 b \\mathbf x=A\^{-1}\\mathbf b x=A−1b,通常矩阵 A A A 是任意的 m × n m\\times n m×n 矩阵,不可逆的,这就促使人们去推广逆矩阵的概念,引进某种具有普通逆矩阵类似性质的矩阵 G G G,使得方程组的解仍可表示为 x = G b \\mathbf x=G\\mathbf b x=Gb 这种简单的形式。 * 若 A G A = A AGA=A AGA=A,则 A x = A G A x = A ( G b ) = b A\\mathbf x=AGA\\mathbf x=A(G\\mathbf b)=\\mathbf b Ax=AGAx=A(Gb)=b,于是 G b G\\mathbf b Gb 是方程的解; * 若 G A G = G GAG=G GAG=G,由于 G A x = G b GA\\mathbf x=G\\mathbf b GAx=Gb,所以 G A x = G A G A x = G A ( G b ) = G b GA\\mathbf x=GAGA\\mathbf x=GA(G\\mathbf b)=G\\mathbf b GAx=GAGAx=GA(Gb)=Gb,于是 G b G\\mathbf b Gb 是方程的解; 对于 m × n m\\times n m×n 维矩阵 A A A,若存在 n × m n\\times m n×m 维矩阵 G G G 满足以下 M-P 方程 (1) A G A = A AGA=A AGA=A (2) G A G = G GAG=G GAG=G (3) ( A G ) T = A G (AG)\^T=AG (AG)T=AG (4) ( G A ) T = G A (GA)\^T=GA (GA)T=GA 的全部或一部分,则称 G G G 为 A A A 的一个**广义逆矩阵** 。若 G G G 满足全部 M-P 方程,则称 G G G 为 A A A 的 Moore-Penrose 广义逆矩阵,简称M-P 广义逆矩阵,也称为伪逆矩阵,记为 A + A\^+ A+。事实上,只有伪逆矩阵存在且唯一,其他各类广义逆矩阵都不唯一。 性质: 1. ( A + ) + = A (A\^+)\^+=A (A+)+=A 2. ( A T ) + = ( A + ) T (A\^T)\^+=(A\^+)\^T (AT)+=(A+)T 3. rank A + = rank A \\text{rank }A\^+=\\text{rank }A rank A+=rank A 若非其次线性方程组 A x = b A\\mathbf x=\\mathbf b Ax=b 有解,则解为 x = A + b + ( I − A + A ) c \\mathbf x=A\^+\\mathbf b+(I-A\^+A)\\mathbf c x=A+b+(I−A+A)c 其中 c \\mathbf c c 是维数与 x \\mathbf x x 的维数相同的任意向量。显然,当 A A A 可逆时, x = A − 1 b + ( I − A − 1 A ) c = A − 1 b \\mathbf x=A\^{-1}\\mathbf b+(I-A\^{-1}A)\\mathbf c=A\^{-1}\\mathbf b x=A−1b+(I−A−1A)c=A−1b 。 求伪逆矩阵的一个方法是利用奇异值分解 A = U Σ V T A=U\\Sigma V\^T A=UΣVT 。由于 Λ r \\Lambda_r Λr 的对角线元素非零,所以 Λ r \\Lambda_r Λr 可逆,可求得伪逆为 A + = V r Λ r − 1 U r T A\^+=V_r\\Lambda_r\^{-1} U\^T_r A+=VrΛr−1UrT