文章目录
矩阵的运算
矩阵的转置
转置 :矩阵 A A A的行列互换得到的矩阵称为 A A A 的转置(transpose),记作 A T A^T AT。
性质:矩阵转置运算满足下列性质:
- ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
- ( A T ) T = A (A^T)^T=A (AT)T=A
- ( k A ) T = k A T (kA)^T=kA^T (kA)T=kAT
- ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT
- ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T
方阵的运算
三角矩阵 :(triangular matrix)主对角线的下方元素都是零的方阵,称为上三角矩阵 。类似的,主对角线的上方元素都是零的方阵,称为下三角矩阵 。
[ a 11 a 12 ⋯ a 1 n a 22 ⋯ a 2 n ⋱ ⋮ a n n ] , [ a 11 a 21 a 22 ⋮ ⋮ ⋱ a n 1 a n 2 ⋯ a n n ] \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ &a_{22}&\cdots&a_{2n} \\ &&\ddots&\vdots \\ &&&a_{nn} \\ \end{bmatrix},\quad \begin{bmatrix} a_{11}&&& \\ a_{21}&a_{22}&& \\ \vdots&\vdots&\ddots& \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{bmatrix} a11a12a22⋯⋯⋱a1na2n⋮ann , a11a21⋮an1a22⋮an2⋱⋯ann
上(下)三角阵的行列式为主对角线元素的乘积
det A = a 11 a 22 ⋯ a n n \det A=a_{11}a_{22}\cdots a_{nn} detA=a11a22⋯ann
对角阵 :不在主对角线上的元素全为零的矩阵称为对角阵 (diagonal matrix),记作
d i a g ( a 1 , a 2 , ⋯ , a n ) = [ a 1 a 2 ⋱ a n ] \mathrm{diag}(a_1,a_2,\cdots,a_n)=\begin{bmatrix} a_1 \\ &a_2 \\ &&\ddots \\ &&&a_n \\ \end{bmatrix} diag(a1,a2,⋯,an)= a1a2⋱an
对角阵有良好的性质:
-
两对角阵的乘积仍为对角阵
[ a 1 a 2 ⋱ a n ] [ b 1 b 2 ⋱ b n ] = [ a 1 b 1 a 2 b 2 ⋱ a n b n ] \begin{bmatrix}a_1 \\&a_2 \\&&\ddots \\&&&a_n \end{bmatrix} \begin{bmatrix}b_1 \\&b_2 \\&&\ddots \\&&&b_n \end{bmatrix}= \begin{bmatrix}a_1b_1 \\&a_2b_2 \\&&\ddots \\&&&a_nb_n \end{bmatrix} a1a2⋱an b1b2⋱bn = a1b1a2b2⋱anbn -
对角阵的幂仍为对角阵
[ a 1 a 2 ⋱ a n ] k = [ a 1 k a 2 k ⋱ a n k ] \begin{bmatrix}a_1 \\&a_2 \\&&\ddots \\&&&a_n \end{bmatrix}^k= \begin{bmatrix}a_1^k \\&a_2^k \\&&\ddots \\&&&a_n^k \end{bmatrix} a1a2⋱an k= a1ka2k⋱ank
数量阵 :主对角线上的元素都相等的对角阵,称为数量阵 (scalar matrix)。
d i a g ( a , a , ⋯ , a ) = [ a a ⋱ a ] \mathrm{diag}(a,a,\cdots,a)=\begin{bmatrix} a \\ &a \\ &&\ddots \\ &&&a \\ \end{bmatrix} diag(a,a,⋯,a)= aa⋱a
数量阵得名于它的乘法。如二阶数量阵
[ k 0 0 k ] A = k [ 1 0 0 1 ] A = k A \begin{bmatrix}k&0 \\ 0&k \end{bmatrix}A=k\begin{bmatrix}1&0 \\ 0&1 \end{bmatrix}A=kA [k00k]A=k[1001]A=kA
单位阵 :主对角线上的元素全为1的对角阵,称为单位阵 (identity matrix)。 n n n 阶单位阵记作 E n E_n En或 I n I_n In。任何矩阵与单位阵的乘积都等于自身。
I 3 = [ 1 0 0 0 1 0 0 0 1 ] I_3=\begin{bmatrix}1&0&0 \\0&1&0 \\0&0&1 \\ \end{bmatrix} I3= 100010001
对称阵 与反对称阵 :设 A = ( a i j ) A=(a_{ij}) A=(aij) 为 n n n阶方阵,若 A T = A A^T=A AT=A ,即 a i j = a j i a_{ij}=a_{ji} aij=aji,则称为对称阵 (symmetric matrix);若 A T = − A A^T=-A AT=−A ,即 a i j = − a j i a_{ij}=-a_{ji} aij=−aji,则称为反对称阵(skew-symmetric matrix)。
易证明 A A T AA^T AAT 和 A T A A^TA ATA 是对称阵。
方阵的幂 :由于矩阵满足结合律,我们可以定义矩阵的幂运算
A 0 = I , A n = A A ⋯ A ⏞ n A^0=I,\quad A^n=\overbrace{AA\cdots A}^n A0=I,An=AA⋯A n
当矩阵 A A A 可逆时,定义
A − k = ( A − 1 ) k A^{-k}=(A^{-1})^k A−k=(A−1)k
显然只有方阵的幂才有意义。幂运算满足如下性质:
- A k A l = A k + l A^kA^l=A^{k+l} AkAl=Ak+l
- ( A k ) l = A k l (A^k)^l=A^{kl} (Ak)l=Akl
注意:因为矩阵乘法无交换率,因此一般情况下 ( A B ) k ≠ A k B k (AB)^k\neq A^kB^k (AB)k=AkBk
初等矩阵
初等变换 :矩阵初等行变换的定义同样适用于列,相应的记法为 c i ↔ c j , k c i , c i + k c j c_i\lrarr c_j,kc_i,c_i+kc_j ci↔cj,kci,ci+kcj 。矩阵的初等行变换和初等列变换统称矩阵的初等变换 。若矩阵 A A A 经有限次初等变换变为 B B B,则称 A A A与 B B B 等价(equivalent) 。
矩阵的初等变换是矩阵的一种最基本运算,其过程可以通过特殊矩阵的乘法来表示。
初等矩阵:由单位矩阵进行一次初等变换得到的矩阵称为初等矩阵(elementary matrix)。易知初等矩阵都是可逆的。
三种初等变换对应着三种初等矩阵。由矩阵的乘法运算可以验证:对矩阵的初等行变换相当于左乘相应的初等矩阵;对矩阵的初等列变换相当于右乘相应的初等矩阵。
-
互换变换,如 r 1 ↔ r 2 r_1\lrarr r_2 r1↔r2
[ 0 1 0 1 0 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ a 2 b 2 a 1 b 1 a 3 b 3 ] \begin{bmatrix}0&1&0 \\1&0&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}a_2&b_2\\a_1&b_1 \\a_3&b_3\end{bmatrix} 010100001 a1a2a3b1b2b3 = a2a1a3b2b1b3 -
倍乘变换,如 2 r 1 2r_1 2r1
[ 2 0 0 0 1 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ 2 a 1 b 1 a 2 b 2 a 3 b 3 ] \begin{bmatrix}2&0&0 \\0&1&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}2a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix} 200010001 a1a2a3b1b2b3 = 2a1a2a3b1b2b3 -
倍加变换,如 r 1 + 2 r 2 r_1+2r_2 r1+2r2
[ 1 2 0 0 1 0 0 0 1 ] [ a 1 b 1 a 2 b 2 a 3 b 3 ] = [ a 1 + 2 a 2 b 1 + 2 b 2 a 2 b 2 a 3 b 3 ] \begin{bmatrix}1&2&0 \\0&1&0\\0&0&1\end{bmatrix} \begin{bmatrix}a_1&b_1 \\a_2&b_2\\a_3&b_3\end{bmatrix}= \begin{bmatrix}a_1+2a_2&b_1+2b_2 \\a_2&b_2\\a_3&b_3\end{bmatrix} 100210001 a1a2a3b1b2b3 = a1+2a2a2a3b1+2b2b2b3
定理:任意一个可逆矩阵都可以表示为有限个初等矩阵的乘积。
由于初等矩阵可逆,所以初等矩阵的乘积亦可逆。
所有矩阵都可通过初等变换化为标准型
[ 1 ⋱ 1 } r 0 ⋱ 0 ] = [ I r O O O ] \begin{bmatrix} \left.\begin{matrix}1&& \\ &\ddots&\\&&1\end{matrix}\right\}r & \\ &\begin{matrix}0 \\ &\ddots&\\&&0\end{matrix} \end{bmatrix}= \begin{bmatrix}I_r&O \\O&O\end{bmatrix} 1⋱1⎭ ⎬ ⎫r0⋱0 =[IrOOO]
分块矩阵
分块矩阵是矩阵运算的一种技巧。
在矩阵的运算和理论研究中,有时对矩阵进行分块处理,常常会简化矩阵的运算,或者使原矩阵显得结构简单而清晰。
[ 1 0 0 0 0 1 0 0 0 0 1 5 ] = [ I 2 O O A ] \begin{bmatrix} \begin{array}{cc:cc} 1&0 & 0 & 0 \\ 0&1 & 0 &0 \\ \hdashline 0&0 & 1 & 5 \end{array}\end{bmatrix} =\begin{bmatrix} I_2 & O \\ O & A \end{bmatrix} 100010001005 =[I2OOA]
像这样,结合矩阵本身的特点,把一个矩阵用横线和竖线划分为若干个子块,并以所分的子块为元素的矩阵称为分块矩阵(Block matrix)。一个矩阵可用不同的方法分块。
分块矩阵的运算形式上和普通矩阵相同,把子块当成元素计算即可。
加法 :设分块 A , B A,B A,B 是同型矩阵,且对它们的分法相同,则 A + B = ( A i j + B i j ) A+B=(A_{ij}+B_{ij}) A+B=(Aij+Bij)
[ A 1 B 1 C 1 D 1 ] + [ A 2 B 2 C 2 D 2 ] = [ A 1 + A 2 B 1 + B 2 C 1 + C 2 D 1 + D 2 ] \begin{bmatrix}A_1 & B_1 \\C_1 & D_1 \end{bmatrix}+ \begin{bmatrix}A_2 & B_2 \\C_2 & D_2 \end{bmatrix}=\begin{bmatrix}A_1+A_2 & B_1+B_2 \\C_1+C_2 & D_1+D_2 \end{bmatrix} [A1C1B1D1]+[A2C2B2D2]=[A1+A2C1+C2B1+B2D1+D2]
数乘 :分块矩阵 A A A ,数乘作用于每个子块。
k [ A B C D ] = [ k A k B k C k D ] k\begin{bmatrix}A & B \\C & D \end{bmatrix}=\begin{bmatrix}kA & kB \\kC & kD \end{bmatrix} k[ACBD]=[kAkCkBkD]
乘法 :分块矩阵的乘法按矩阵乘法的形式计算。
A B = A [ b 1 b 2 ⋯ b p ] = [ A b 1 A b 2 ⋯ A b p ] AB=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_p\end{bmatrix}= \begin{bmatrix}A\mathbf b_1&A\mathbf b_2&\cdots&A\mathbf b_p\end{bmatrix} AB=A[b1b2⋯bp]=[Ab1Ab2⋯Abp]
矩阵乘法的列行展开
A B = [ a 1 a 2 ⋯ a n ] [ b 1 b 2 ⋮ b n ] = a 1 b 1 + a 2 b 2 + ⋯ + a n b n AB=\begin{bmatrix}\mathbf a_1&\mathbf a_2&\cdots&\mathbf a_n\end{bmatrix} \begin{bmatrix}\mathbf b_1\\\mathbf b_2\\\vdots\\\mathbf b_n\end{bmatrix} =\mathbf a_1\mathbf b_1+\mathbf a_2\mathbf b_2+\cdots+\mathbf a_n\mathbf b_n AB=[a1a2⋯an] b1b2⋮bn =a1b1+a2b2+⋯+anbn
转置 :分块矩阵 A = ( A i j ) A=(A_{ij}) A=(Aij) 的转置等于各子块的转置 A T = ( A i j T ) A^T=(A_{ij}^T) AT=(AijT)
分块上三角矩阵 :
[ A B O D ] − 1 = [ A − 1 − A − 1 B D − 1 O D − 1 ] \begin{bmatrix}A&B\\O&D\end{bmatrix}^{-1}= \begin{bmatrix}A^{-1}&-A^{-1}BD^{-1}\\O&D^{-1}\end{bmatrix} [AOBD]−1=[A−1O−A−1BD−1D−1]
设分块矩阵 [ X 1 X 2 X 3 X 4 ] \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} [X1X3X2X4] 是矩阵 [ A B O D ] \begin{bmatrix}A&B\\O&D\end{bmatrix} [AOBD] 的逆,则
[ A B O D ] [ X 1 X 2 X 3 X 4 ] = [ I p O O I q ] \begin{bmatrix}A&B\\O&D\end{bmatrix} \begin{bmatrix}X_1&X_2\\X_3&X_4\end{bmatrix} =\begin{bmatrix}I_p&O\\O&I_q\end{bmatrix} [AOBD][X1X3X2X4]=[IpOOIq]
这个矩阵方程包含了4个未知子块的方程
A X 1 + B X 3 = I p A X 2 + B X 4 = O D X 3 = O D X 4 = I q AX_1+BX_3=I_p \\ AX_2+BX_4=O \\ DX_3=O \\ DX_4=I_q AX1+BX3=IpAX2+BX4=ODX3=ODX4=Iq
若 D D D 可逆,从后两个方程可以得到 X 3 = O , X 4 = D − 1 X_3=O,X_4=D^{-1} X3=O,X4=D−1 ;若 A A A 可逆,进一步可以得到 X 1 = A − 1 , X 2 = − A − 1 B D − 1 X_1=A^{-1},X_2=-A^{-1}BD^{-1} X1=A−1,X2=−A−1BD−1 。便可获得分块上三角矩阵的逆。
分块对角矩阵:分块对角矩阵拥有良好的性质。
(1) 分块对角矩阵乘积
[ A 1 A 2 ⋱ A s ] [ B 1 B 2 ⋱ B s ] = [ A 1 B 1 A 2 B 2 ⋱ A s B s ] \begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix} \begin{bmatrix}B_1 \\&B_2 \\&&\ddots \\&&&B_s \end{bmatrix} =\begin{bmatrix}A_1B_1 \\&A_2B_2 \\&&\ddots \\&&&A_sB_s \end{bmatrix} A1A2⋱As B1B2⋱Bs = A1B1A2B2⋱AsBs
(2) 若分块对角矩阵的各个子块可逆,则该对角分块矩阵可逆
[ A 1 A 2 ⋱ A s ] − 1 = [ A 1 − 1 A 2 − 1 ⋱ A s − 1 ] \begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix}^{-1}= \begin{bmatrix}A_1^{-1} \\&A_2^{-1} \\&&\ddots \\&&&A_s^{-1} \end{bmatrix} A1A2⋱As −1= A1−1A2−1⋱As−1
(3) 分块对角矩阵的行列式为对角位置的行列式乘积
det [ A 1 A 2 ⋱ A s ] = det A 1 det A 2 ⋯ det A s \det\begin{bmatrix}A_1 \\&A_2 \\&&\ddots \\&&&A_s \end{bmatrix} =\det A_1\det A_2\cdots\det A_s det A1A2⋱As =detA1detA2⋯detAs
逆矩阵
利用克拉默法可以容易地导出一个求矩阵的逆的一般公式。设矩阵 A = ( a i j ) n × n A=(a_{ij}){n\times n} A=(aij)n×n 的逆矩阵 A − 1 = ( b i j ) n × n A^{-1}=(b{ij})_{n\times n} A−1=(bij)n×n ,利用分块矩阵的乘法
A A − 1 = A [ b 1 b 2 ⋯ b n ] = I n = [ e 1 e 2 ⋯ e n ] AA^{-1}=A\begin{bmatrix}\mathbf b_1&\mathbf b_2&\cdots&\mathbf b_n\end{bmatrix} =I_n=\begin{bmatrix}\mathbf e_1&\mathbf e_2&\cdots&\mathbf e_n\end{bmatrix} AA−1=A[b1b2⋯bn]=In=[e1e2⋯en]
其中 b j \mathbf b_j bj 是矩阵 A − 1 A^{-1} A−1 的第 j j j 列, e j \mathbf e_j ej 是单位阵 I n I_n In 的第 j j j 列。于是
A b j = e j A\mathbf b_j=\mathbf e_j Abj=ej
向量 b j \mathbf b_j bj 的第 i i i 个元素是 A − 1 A^{-1} A−1 的元素 b i j b_{ij} bij 。由克拉默法则求得
b i j = det A i ( e j ) det A b_{ij}=\frac{\det A_i(\mathbf e_j)}{\det A} bij=detAdetAi(ej)
回顾代数余子式的定义,它是把矩阵 A A A 中元素 a i j a_{ij} aij 所在的行和列划掉后得到的。 det A i ( e j ) \det A_i(\mathbf e_j) detAi(ej) 按第 i i i 列的余子展开式为
det A i ( e j ) = ( − 1 ) i + j M j i = A j i \det A_i(\mathbf e_j)=(-1)^{i+j}M_{ji}=A_{ji} detAi(ej)=(−1)i+jMji=Aji
于是可写出矩阵 A A A 的逆
A − 1 = 1 det A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A
其中 adj A \text{adj }A adj A 是矩阵 A A A 的各个元素的代数余子式 A j i A_{ji} Aji 所构成的矩阵
adj A = [ A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ] \text{adj }A=\begin{bmatrix} A_{11}&A_{21}&\cdots&A_{n1} \\ A_{12}&A_{22}&\cdots&A_{n2} \\ \vdots&\vdots&\ddots&\vdots \\ A_{1n}&A_{2n}&\cdots&A_{nn} \\ \end{bmatrix} adj A= A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann
做矩阵 A A A的伴随矩阵(Adjugate Matrix) 。
注意,伴随矩阵里代数余子式的排列顺序是颠倒的。
定理:方阵 A A A 可逆的充要条件是 det A ≠ 0 \det A\neq0 detA=0 ,且 A − 1 = 1 det A adj A A^{-1}=\dfrac{1}{\det A}\text{adj }A A−1=detA1adj A
此定理仅适用于理论上的计算矩阵的逆,使我们不用实际计算出 A − 1 A^{-1} A−1 就可以推导出性质。
这里给出二阶方阵 A = [ a b c d ] A=\begin{bmatrix}a&b\\c&d\end{bmatrix} A=[acbd] 的逆,若 det A = a d − b c ≠ 0 \det A=ad-bc\neq0 detA=ad−bc=0 则
A − 1 = 1 a d − b c [ d − b − c a ] A^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix} A−1=ad−bc1[d−c−ba]
推论:
- 若 n n n 阶方阵 A , B A,B A,B 满足 A B = I AB=I AB=I 或 B A = I BA=I BA=I ,则 B = A − 1 B=A^{-1} B=A−1 。
- A ( adj A ) = ( adj A ) A = ( det A ) I A(\text{adj }A)=(\text{adj }A)A=(\det A)I A(adj A)=(adj A)A=(detA)I
有了推论1,只需判断 A B = I AB=I AB=I 或 B A = I BA=I BA=I 中的一个条件就可判定逆矩阵,要比定义简单一些。
利用初等变换计算逆矩阵 :写出增广矩阵 ( A ∣ I ) (A\mid I) (A∣I), 用初等行变换把左边矩阵 A A A 处化为单位矩阵 I I I ,则右边出来的就是逆矩阵 A − 1 A^{-1} A−1,示意如下:
( A ∣ I ) → ( I ∣ A − 1 ) (A\mid I)\xrightarrow{}(I\mid A^{-1}) (A∣I) (I∣A−1)
同样,利用初等列变换计算逆矩阵的示意如下
[ A I ] → [ I A − 1 ] \begin{bmatrix}A\\I\end{bmatrix}\xrightarrow{}\begin{bmatrix}I\\A^{-1}\end{bmatrix} [AI] [IA−1]
示例:解矩阵方程
[ 1 0 1 − 1 1 1 2 − 1 1 ] [ x 1 y 1 x 2 y 2 x 3 y 3 ] = [ 1 1 0 1 − 1 0 ] \begin{bmatrix}1&0&1\\-1&1&1\\2&-1&1\end{bmatrix} \begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\\\end{bmatrix}= \begin{bmatrix}1&1\\0&1\\-1&0\\\end{bmatrix} 1−1201−1111 x1x2x3y1y2y3 = 10−1110
解:系数矩阵可逆的矩阵方程 A X = B AX=B AX=B ,解为 X = A − 1 B X=A^{-1}B X=A−1B 。实际中,不必求逆矩阵,可使用一系列初等变换求解,即系数矩阵和常数项做同样的变换 P = A − 1 P=A^{-1} P=A−1。图示如下
( A ∣ B ) → ( I ∣ X ) (A\mid B)\xrightarrow{}(I\mid X) (A∣B) (I∣X)
本例计算过程如下
[ 1 0 1 1 1 − 1 1 1 0 1 2 − 1 1 − 1 0 ] → [ 1 0 0 3 1 0 1 0 5 2 0 0 1 − 2 0 ] \begin{bmatrix} \begin{array}{ccc:cc} 1&0&1&1&1\\ -1&1&1&0&1\\ 2&-1&1&-1&0 \end{array} \end{bmatrix}\to \begin{bmatrix} \begin{array}{ccc:cc} 1&0&0&3&1\\ 0&1&0&5&2\\ 0&0&1&-2&0 \end{array} \end{bmatrix} 1−1201−111110−1110 → 10001000135−2120
故
[ x 1 y 1 x 2 y 2 x 3 y 3 ] = [ 3 1 5 2 − 2 0 ] \begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\end{bmatrix}= \begin{bmatrix}3&1\\5&2\\-2&0\end{bmatrix} x1x2x3y1y2y3 = 35−2120
矩阵的秩
行空间 :矩阵 A = ( r 1 , r 2 , ⋯ , r m ) T A=(\mathbf r_1,\mathbf r_2,\cdots,\mathbf r_m)^T A=(r1,r2,⋯,rm)T 的所有行向量张成的空间称为 A A A 的行空间,记为
row A = span { r 1 , r 2 , ⋯ , r m } \text{row }A=\text{span}\{\mathbf r_1,\mathbf r_2,\cdots,\mathbf r_m\} row A=span{r1,r2,⋯,rm}
若两个矩阵 A A A 和 B B B 行等价,则它们的的行空间相同。若 B B B 是阶梯型矩阵,则 B B B 的非零行构成 row B \text{row }B row B 的一组基,同时也是 row A \text{row }A row A 的一组基。
证明:若 B B B 是由 A A A 经行变换得到的,则 B B B 的行是 A A A 的行的线性组合,于是 B B B 的行的任意线性组合自然是 A A A 的行的线性组合,从而 B B B 的行空间包含于 A A A 的行空间。因为行变换可逆,同理知 A A A 的行空间是 B B B 的行空间的子集,从而这两个空间相同。若 B B B 是一个阶梯形矩阵,则其非零行是线性无关的,这是因为任何一个非零行均不为它下面的非零行的线性组合,于是 B B B 的非零行构成 B B B 的行空间的一组基,当然也是 A A A 的行空间的一组基。
例:分别求矩阵 A A A 的行空间、列空间和零空间的基
A = [ − 2 − 5 8 0 − 17 1 3 − 5 1 5 3 11 − 19 7 1 1 7 − 13 5 − 3 ] A=\begin{bmatrix}-2&-5&8&0&-17\\1&3&-5&1&5\\3&11&-19&7&1\\1&7&-13&5&-3\end{bmatrix} A= −2131−531178−5−19−130175−1751−3
解:为了求行空间和列空间的基,行化简 A A A成阶梯形
A → [ 1 3 − 5 1 5 0 1 − 2 2 − 7 0 0 0 − 4 20 0 0 0 0 0 ] = B A\to \begin{bmatrix}1&3&-5&1&5\\0&1&-2&2&-7\\0&0&0&-4&20\\0&0&0&0&0\end{bmatrix}=B A→ 10003100−5−20012−405−7200 =B
矩阵 B B B 的前 3 行构成 B B B的行空间的一个基,也是 A A A的行空间的一组基。
row A \text{row }A row A 的基: ( 1 , 3 , − 5 , 1 , 5 ) , ( 0 , 1 , − 2 , 2 , − 7 ) , ( 0 , 0 , 0 , − 4 , 20 ) (1,3,-5,1,5),(0,1,-2,2,-7),(0,0,0,-4,20) (1,3,−5,1,5),(0,1,−2,2,−7),(0,0,0,−4,20)
对列空间, B B B 的主元列在第1,2和4列,从而 A A A 的第1,2和4列构成 col A \text{col }A col A 的一组基。
col A \text{col }A col A 的基: ( − 2 , 1 , 3 , 1 ) T , ( − 5 , 3 , 11 , 7 ) T , ( 0 , 1 , 7 , 5 ) T (-2,1,3,1)^T,(-5,3,11,7)^T,(0,1,7,5)^T (−2,1,3,1)T,(−5,3,11,7)T,(0,1,7,5)T
对于核空间,需要进一步行变换得简化阶梯型矩阵
B → [ 1 0 1 0 1 0 1 − 2 0 3 0 0 0 1 − 5 0 0 0 0 0 ] = C B\to\begin{bmatrix}1&0&1&0&1\\0&1&-2&0&3\\0&0&0&1&-5\\0&0&0&0&0\end{bmatrix}=C B→ 100001001−200001013−50 =C
方程 A x = 0 A\mathbf x=0 Ax=0 的解空间等价于 C x = 0 C\mathbf x=0 Cx=0 的解空间,即
{ x 1 + x 3 + x 5 = 0 x 2 − 2 x 3 + 3 x 5 = 0 x 4 − 5 x 5 = 0 \begin{cases} x_1+x_3+x_5=0 \\ x_2-2x_3+3x_5=0 \\ x_4-5x_5=0 \end{cases} ⎩ ⎨ ⎧x1+x3+x5=0x2−2x3+3x5=0x4−5x5=0
所以
[ x 1 x 2 x 3 x 4 x 5 ] = x 3 [ − 1 2 1 0 0 ] + x 5 [ − 1 − 3 0 5 1 ] \begin{bmatrix}x_1\\x_2\\x_3\\x_4\\x_5\end{bmatrix}= x_3\begin{bmatrix}-1\\2\\1\\0\\0\end{bmatrix}+ x_5\begin{bmatrix}-1\\-3\\0\\5\\1\end{bmatrix} x1x2x3x4x5 =x3 −12100 +x5 −1−3051
ker A \ker A kerA 的基: ( − 1 , 2 , 1 , 0 , 0 ) T , ( − 1 , − 3 , 0 , 5 , 1 ) T (-1,2,1,0,0)^T,(-1,-3,0,5,1)^T (−1,2,1,0,0)T,(−1,−3,0,5,1)T
通过观察可见,与 col A \text{col }A col A 的基不同, row A \text{row }A row A 和 ker A \ker A kerA 的基与 A A A 中的元素没有直接的关系。
定理:对于 m × n m\times n m×n 维矩阵 A A A
- dim ( row A ) = dim ( col A ) = rank A \dim(\text{row }A)=\dim(\text{col }A)=\text{rank }A dim(row A)=dim(col A)=rank A
- rank A + dim ( ker A ) = n \text{rank }A+\dim(\ker A)=n rank A+dim(kerA)=n
证明: rank A \text{rank }A rank A 是 A A A中主元列的个数,也是 A A A的等价阶梯形矩阵 B B B中主元列的个数。进一步,因为 B B B 的每个主元都对应一个非零行,同时这些非零行构成 A A A 的行空间的一组基,所以 A A A 的秩等于 row A \text{row }A row A 的维数。由于 ker A \ker A kerA 的维数等于方程 A x = 0 A\mathbf x=0 Ax=0 中自由变量的个数,换句话说, ker A \ker A kerA 的维数是 A A A 中非主元列的个数。上面的定理证闭。
性质:
- 矩阵的秩在初等变换下保持不变
- 矩阵的列向量组的秩等于行向量组的秩
- rank ( A + B ) ⩽ rank ( A ) + rank ( B ) \text{rank}(A+B)\leqslant \text{rank}(A)+\text{rank}(B) rank(A+B)⩽rank(A)+rank(B)
- rank ( k A ) = rank ( A ) \text{rank}(kA)=\text{rank}(A) rank(kA)=rank(A)
- rank ( A B ) ⩽ min { rank ( A ) , rank ( B ) } \text{rank}(AB)\leqslant \min\{\text{rank}(A),\text{rank}(B)\} rank(AB)⩽min{rank(A),rank(B)}
广义逆矩阵
对于非其次线性方程组 A x = b A\mathbf x=\mathbf b Ax=b ,当 A A A 可逆时,则方程组存在唯一解 x = A − 1 b \mathbf x=A^{-1}\mathbf b x=A−1b,通常矩阵 A A A 是任意的 m × n m\times n m×n 矩阵,不可逆的,这就促使人们去推广逆矩阵的概念,引进某种具有普通逆矩阵类似性质的矩阵 G G G,使得方程组的解仍可表示为 x = G b \mathbf x=G\mathbf b x=Gb 这种简单的形式。
- 若 A G A = A AGA=A AGA=A,则 A x = A G A x = A ( G b ) = b A\mathbf x=AGA\mathbf x=A(G\mathbf b)=\mathbf b Ax=AGAx=A(Gb)=b,于是 G b G\mathbf b Gb 是方程的解;
- 若 G A G = G GAG=G GAG=G,由于 G A x = G b GA\mathbf x=G\mathbf b GAx=Gb,所以 G A x = G A G A x = G A ( G b ) = G b GA\mathbf x=GAGA\mathbf x=GA(G\mathbf b)=G\mathbf b GAx=GAGAx=GA(Gb)=Gb,于是 G b G\mathbf b Gb 是方程的解;
对于 m × n m\times n m×n 维矩阵 A A A,若存在 n × m n\times m n×m 维矩阵 G G G 满足以下 M-P 方程
(1) A G A = A AGA=A AGA=A
(2) G A G = G GAG=G GAG=G
(3) ( A G ) T = A G (AG)^T=AG (AG)T=AG
(4) ( G A ) T = G A (GA)^T=GA (GA)T=GA
的全部或一部分,则称 G G G 为 A A A 的一个广义逆矩阵 。若 G G G 满足全部 M-P 方程,则称 G G G 为 A A A 的 Moore-Penrose 广义逆矩阵,简称M-P 广义逆矩阵,也称为伪逆矩阵,记为 A + A^+ A+。事实上,只有伪逆矩阵存在且唯一,其他各类广义逆矩阵都不唯一。
性质:
- ( A + ) + = A (A^+)^+=A (A+)+=A
- ( A T ) + = ( A + ) T (A^T)^+=(A^+)^T (AT)+=(A+)T
- rank A + = rank A \text{rank }A^+=\text{rank }A rank A+=rank A
若非其次线性方程组 A x = b A\mathbf x=\mathbf b Ax=b 有解,则解为
x = A + b + ( I − A + A ) c \mathbf x=A^+\mathbf b+(I-A^+A)\mathbf c x=A+b+(I−A+A)c
其中 c \mathbf c c 是维数与 x \mathbf x x 的维数相同的任意向量。显然,当 A A A 可逆时, x = A − 1 b + ( I − A − 1 A ) c = A − 1 b \mathbf x=A^{-1}\mathbf b+(I-A^{-1}A)\mathbf c=A^{-1}\mathbf b x=A−1b+(I−A−1A)c=A−1b 。
求伪逆矩阵的一个方法是利用奇异值分解 A = U Σ V T A=U\Sigma V^T A=UΣVT 。由于 Λ r \Lambda_r Λr 的对角线元素非零,所以 Λ r \Lambda_r Λr 可逆,可求得伪逆为
A + = V r Λ r − 1 U r T A^+=V_r\Lambda_r^{-1} U^T_r A+=VrΛr−1UrT