Part 2 矩阵

文章目录

  • 一、矩阵的本质
    • [1.1 线性变换视角](#1.1 线性变换视角)
    • [1.2 数据组织视角](#1.2 数据组织视角)
    • [1.3 矩阵的核心特征与变换本质](#1.3 矩阵的核心特征与变换本质)
    • [1.4 核心关联:秩与行列式](#1.4 核心关联:秩与行列式)
  • 二、矩阵的定义与基本运算
    • [2.1 矩阵的定义](#2.1 矩阵的定义)
    • [2.2 矩阵的基本运算](#2.2 矩阵的基本运算)
      • [2.2.1 相等](#2.2.1 相等)
      • [2.2.2 矩阵加法](#2.2.2 矩阵加法)
      • [2.2.3 数与矩阵的乘法(数乘)](#2.2.3 数与矩阵的乘法(数乘))
      • [2.2.4 矩阵乘法](#2.2.4 矩阵乘法)
      • [2.2.5 转置运算](#2.2.5 转置运算)
      • [2.2.6 方阵的幂运算](#2.2.6 方阵的幂运算)
      • [2.2.7 方阵的行列式](#2.2.7 方阵的行列式)
  • 三、特殊矩阵类型
  • 四、逆矩阵
    • [4.1 定义](#4.1 定义)
    • [4.2 可逆判定(充要条件)](#4.2 可逆判定(充要条件))
    • [4.3 核心性质](#4.3 核心性质)
    • [4.4 逆矩阵的求法](#4.4 逆矩阵的求法)
      • [4.4.1 定义法](#4.4.1 定义法)
      • [4.4.2 伴随矩阵法](#4.4.2 伴随矩阵法)
      • [4.4.3 初等变换法(核心方法)](#4.4.3 初等变换法(核心方法))
    • [4.5 分块矩阵的逆](#4.5 分块矩阵的逆)
      • [4.5.1 对角分块矩阵](#4.5.1 对角分块矩阵)
      • [4.5.2 反对角分块矩阵](#4.5.2 反对角分块矩阵)
      • [4.5.3 三角分块矩阵](#4.5.3 三角分块矩阵)
  • 五、伴随矩阵
    • [5.1 定义](#5.1 定义)
    • [5.2 核心性质](#5.2 核心性质)
    • [5.3 伴随矩阵的求法](#5.3 伴随矩阵的求法)
      • [5.3.1 定义法(通用)](#5.3.1 定义法(通用))
      • [5.3.2 公式法(仅可逆矩阵)](#5.3.2 公式法(仅可逆矩阵))
  • 六、初等变换与初等矩阵
    • [6.1 矩阵的初等变换](#6.1 矩阵的初等变换)
    • [6.2 初等矩阵的定义](#6.2 初等矩阵的定义)
    • [6.3 初等矩阵的性质与重要公式](#6.3 初等矩阵的性质与重要公式)
    • [6.4 行阶梯形矩阵与行最简阶梯型矩阵](#6.4 行阶梯形矩阵与行最简阶梯型矩阵)
      • [6.4.1 行阶梯形矩阵(Row Echelon Form, REF)](#6.4.1 行阶梯形矩阵(Row Echelon Form, REF))
      • [6.4.2 行最简阶梯型矩阵(Reduced REF, RREF)](#6.4.2 行最简阶梯型矩阵(Reduced REF, RREF))
  • 七、矩阵方程
    • [7.1 常见形式与求解核心](#7.1 常见形式与求解核心)
    • [7.2 实例演示](#7.2 实例演示)
  • 八、等价矩阵
    • [8.1 定义](#8.1 定义)
    • [8.2 等价标准形](#8.2 等价标准形)
    • [8.3 等价判定(充要条件)](#8.3 等价判定(充要条件))
    • [8.4 性质](#8.4 性质)
  • 九、矩阵的秩
    • [9.1 定义](#9.1 定义)
    • [9.2 核心性质](#9.2 核心性质)
    • [9.3 求法](#9.3 求法)
    • [9.4 秩的关系证明](#9.4 秩的关系证明)

一、矩阵的本质

矩阵是线性变换的具象化表达 ,也是多维度数据的结构化存储载体,其核心价值在于刻画系统信息与变换规律,而非单纯的数字排列。

1.1 线性变换视角

平面或空间中的旋转、缩放、投影等线性变换,均可通过对应矩阵精准描述。

例如,平面内点绕原点逆时针旋转 θ \theta θ 角的线性变换,对应矩阵为 ( cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ) \begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix} (cosθsinθ−sinθcosθ)。

若点坐标为 ( x , y ) (x,y) (x,y),变换后新坐标 ( x ′ , y ′ ) (x',y') (x′,y′) 满足 ( x ′ y ′ ) = ( cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ) ( x y ) \begin{pmatrix}x'\\y'\end{pmatrix}=\begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix} (x′y′)=(cosθsinθ−sinθcosθ)(xy)。

1.2 数据组织视角

在数据分析、图像处理等领域,矩阵是多维度数据的天然存储结构。例如:

  • 灰度图像的每个像素灰度值可构成矩阵,矩阵行数对应图像高度,列数对应宽度,元素值表征对应位置像素的灰度强度;
  • 多维数据集(如电商用户-商品消费矩阵)中,行代表用户、列代表商品,元素值为消费金额,可直观反映用户消费偏好。

矩阵是系统信息的载体,数乘矩阵需将每个元素乘以常数 k k k,以保证系统特性不变,因此 n n n 阶矩阵 A A A 满足 ∣ k A ∣ = k n ∣ A ∣ |kA|=k^n|A| ∣kA∣=kn∣A∣。

1.3 矩阵的核心特征与变换本质

矩阵类型/运算 本质变换 核心说明
正交矩阵( A A T = A T A = E AA^T=A^TA=E AAT=ATA=E) 旋转变换 仅改变数据方向,不改变数据间相对距离与夹角(如空间向量旋转、坐标系正交变换)
上/下三角矩阵 剪切变形 沿主对角线方向对数据做剪切调整,主对角线元素保持不变
矩阵 A ± B A\pm B A±B 平移变换 对数据进行整体位置偏移,仅改变数据绝对位置,不改变数据分布特征
数乘矩阵 k A kA kA 缩放变换 所有元素等比例缩放,保持系统结构与数据相对关系不变

1.4 核心关联:秩与行列式

  • 矩阵的秩:行/列向量间的线性无关性程度,是矩阵信息表达能力的核心指标(秩越高,矩阵承载的有效信息越多);
  • 行列式:仅适用于方阵,刻画线性变换的"伸缩系数"(面积/体积缩放比例),是运算规则(两竖线为运算符号),矩阵本身仅承载系统信息,不直接对应运算。

二、矩阵的定义与基本运算

2.1 矩阵的定义

由 m × n m\times n m×n 个实数(或复数) a i j a_{ij} aij( i = 1 , 2 , ⋯   , m i = 1,2,\cdots,m i=1,2,⋯,m; j = 1 , 2 , ⋯   , n j = 1,2,\cdots,n j=1,2,⋯,n)按行列顺序排列的矩形数表,称为 m m m 行 n n n 列矩阵,简称 m × n m\times n m×n 矩阵,记为:

A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}\end{pmatrix} A= a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn

可简记为 A = ( a i j ) m × n A = (a_{ij}){m\times n} A=(aij)m×n 或 A m × n A{m\times n} Am×n。

分类 定义 核心特征
方阵 m = n m=n m=n 的矩阵称为 n n n 阶方阵 可定义行列式、逆矩阵、幂运算,是线性变换中"空间到自身映射"的核心载体
同型矩阵 行数、列数分别相等的两个矩阵 可进行加减运算,保证元素一一对应
零矩阵 O O O 所有元素为0的矩阵 矩阵加法的单位元( A + O = A A+O=A A+O=A),代表"无变换/无数据"状态
单位矩阵 E E E (或 I I I ) 主对角线为1,其余为0的方阵 矩阵乘法的单位元( E A = A E = A EA=AE=A EA=AE=A),代表"恒等变换"(数据/向量不发生任何改变)

格式规范:矩阵符号无绝对统一标准,数学领域常用圆括号/方括号,编程领域按语言语法(如Python用方括号),同一语境需保持形式统一。

2.2 矩阵的基本运算

2.2.1 相等

定义 :两个矩阵 A A A、 B B B 为同型矩阵,且所有对应元素完全相等,则称 A A A 与 B B B 相等(记为 A = B A=B A=B)。

核心:同型是前提,元素全同是关键(缺一不可)。

2.2.2 矩阵加法

定义 :同型矩阵对应元素相加。设 A = ( a i j ) m × n A=(a_{ij}){m\times n} A=(aij)m×n, B = ( b i j ) m × n B=(b{ij}){m\times n} B=(bij)m×n,则: A + B = ( a i j + b i j ) m × n A + B=(a{ij}+b_{ij})_{m\times n} A+B=(aij+bij)m×n

性质

  • 交换律: A + B = B + A A + B = B + A A+B=B+A
  • 结合律: ( A + B ) + C = A + ( B + C ) (A + B)+C = A+(B + C) (A+B)+C=A+(B+C)
  • 负矩阵: A + ( − A ) = O A+(-A)=O A+(−A)=O(负矩阵 − A -A −A 定义为 ( − a i j ) m × n (-a_{ij})_{m\times n} (−aij)m×n)

2.2.3 数与矩阵的乘法(数乘)

定义 :设 k k k 为任意实数(或复数), A = ( a i j ) m × n A=(a_{ij}){m\times n} A=(aij)m×n ,则: k A = ( k a i j ) m × n kA=(ka{ij})_{m\times n} kA=(kaij)m×n

性质

  • 分配律: k ( A + B ) = k A + k B k(A + B)=kA + kB k(A+B)=kA+kB ; ( k + l ) A = k A + l A (k + l)A=kA + lA (k+l)A=kA+lA

  • 结合律: k ( l A ) = ( k l ) A k(lA)=(kl)A k(lA)=(kl)A

  • 单位数性质: 1 ⋅ A = A 1\cdot A = A 1⋅A=A ; 0 ⋅ A = O 0\cdot A = O 0⋅A=O

加法与数乘统称为矩阵的线性运算 ,满足交换律、结合律、分配律,运算规则与中学代数一致( A , B , C A,B,C A,B,C 为同型矩阵, k , l k,l k,l 为任意常数)。

2.2.4 矩阵乘法

定义 :设 A = ( a i j ) m × s A=(a_{ij}){m\times s} A=(aij)m×s , B = ( b i j ) s × n B=(b{ij}){s\times n} B=(bij)s×n ,则 A A A 与 B B B 的乘积 A B = ( c i j ) m × n AB=(c{ij}){m\times n} AB=(cij)m×n ,其中: c i j = ∑ k = 1 s a i k b k j c{ij}=\sum_{k = 1}^{s}a_{ik}b_{kj} cij=∑k=1saikbkj

(即 A A A 的第 i i i 行与 B B B 的第 j j j 列对应元素相乘后求和,本质是行向量与列向量的内积)。

前提:左矩阵的列数 = 右矩阵的行数(否则乘法无意义)。

性质

  • 结合律: ( A B ) C = A ( B C ) (AB)C = A(BC) (AB)C=A(BC)

  • 分配律: A ( B + C ) = A B + A C A(B + C)=AB + AC A(B+C)=AB+AC ; ( B + C ) A = B A + C A (B + C)A=BA + CA (B+C)A=BA+CA

  • 数乘结合律: k ( A B ) = ( k A ) B = A ( k B ) k(AB)=(kA)B = A(kB) k(AB)=(kA)B=A(kB)

重要注意事项

  • 不满足交换律:一般情况下 A B ≠ B A AB\neq BA AB=BA (如 A 2 × 3 A_{2\times3} A2×3 、 B 3 × 2 B_{3\times2} B3×2 , A B AB AB 是 2 阶方阵, B A BA BA 是 3 阶方阵);

  • 不满足消去律:若 A B = A C AB = AC AB=AC 且 A ≠ O A\neq O A=O ,不一定有 B = C B = C B=C ;

  • 零乘积特性: A B = O ⇏ A = O AB=O\not\Rightarrow A=O AB=O⇒A=O 或 B = O B=O B=O (如 A = ( 1 0 0 0 ) A=\begin{pmatrix}1&0\\0&0\end{pmatrix} A=(1000) , B = ( 0 0 0 1 ) B=\begin{pmatrix}0&0\\0&1\end{pmatrix} B=(0001) , A B = O AB=O AB=O 但 A , B ≠ O A,B\neq O A,B=O )。

2.2.5 转置运算

定义 :将 m × n m\times n m×n 矩阵 A A A 的行与列互换,得到的 n × m n\times m n×m 矩阵称为 A A A 的转置矩阵,记为 A T A^T AT 。若 A = ( a i j ) m × n A=(a_{ij}){m\times n} A=(aij)m×n ,则 A T = ( a j i ) n × m A^T=(a{ji})_{n\times m} AT=(aji)n×m 。

性质

  • 自反性: ( A T ) T = A (A^T)^T = A (AT)T=A

  • 数乘兼容性: ( k A ) T = k A T (kA)^T = kA^T (kA)T=kAT

  • 加减兼容性: ( A ± B ) T = A T ± B T (A \pm B)^T = A^T \pm B^T (A±B)T=AT±BT

  • 乘积反序: ( A B ) T = B T A T (AB)^T = B^T A^T (AB)T=BTAT (推广: ( A 1 A 2 ⋯ A k ) T = A k T ⋯ A 2 T A 1 T (A_1A_2\cdots A_k)^T=A_k^T\cdots A_2^T A_1^T (A1A2⋯Ak)T=AkT⋯A2TA1T )

2.2.6 方阵的幂运算

定义 : n n n 阶方阵 A A A 的 m m m 次幂( m m m 为正整数):

A m = A ⋅ A ⋅ ⋯ ⋅ A ⏞ m 个 A A^m = \overbrace{A \cdot A \cdot \cdots \cdot A}^{m \text{个} A} Am=A⋅A⋅⋯⋅A m个A

规定: A 0 = E A^0=E A0=E (单位矩阵)。

常用求法

  1. 试算归纳:计算 A 2 , A 3 A^2,A^3 A2,A3 ,归纳幂运算规律(如对角矩阵的幂为对角元素分别取幂);

  2. 满秩分解法:若 r ( A ) = 1 r(A)=1 r(A)=1 ,可分解为 A = α β T A=\alpha\beta^T A=αβT ( α , β \alpha,\beta α,β 为列向量),则:

    A m = ( ∑ i = 1 n a i i ) m − 1 α β T = [ tr ( A ) ] m − 1 A A^m=(\sum\limits_{i=1}^n{a_{ii}})^{m-1}\alpha\beta^T=[\text{tr}(A)]^{m-1}A Am=(i=1∑naii)m−1αβT=[tr(A)]m−1A

    ( tr ( A ) \text{tr}(A) tr(A) 为矩阵迹 trace,即主对角线元素和);

  3. 牛顿二项展开法:若 A = X + Y A=X+Y A=X+Y 且 X Y = Y X XY=YX XY=YX (如 X = k E X=kE X=kE ),则:

    ( X + Y ) m = ∑ k = 0 m C m k X m − k Y k (X+Y)^m=\sum_{k=0}^m C_m^k X^{m-k}Y^k (X+Y)m=∑k=0mCmkXm−kYk

核心提醒

  • 因矩阵乘法不满足交换律,故 ( A + B ) ( A − B ) ≠ A 2 − B 2 (A+B)(A-B)\neq A^2-B^2 (A+B)(A−B)=A2−B2 , ( A B ) m ≠ A m B m (AB)^m\neq A^mB^m (AB)m=AmBm ;

  • 矩阵多项式:若 f ( x ) = a 0 + a 1 x + ⋯ + a m x m f(x)=a_0+a_1x+\cdots+a_mx^m f(x)=a0+a1x+⋯+amxm ,则 f ( A ) = a 0 E + a 1 A + ⋯ + a m A m f(A)=a_0E+a_1A+\cdots+a_mA^m f(A)=a0E+a1A+⋯+amAm (必须保留单位矩阵 E E E ,保证运算维度一致)。

2.2.7 方阵的行列式

定义 : n n n 阶方阵 A A A 的行列式记为 ∣ A ∣ |A| ∣A∣ (或 det ⁡ A \det A detA ),是刻画方阵对应线性变换"伸缩系数"的标量值。

核心性质

  1. 转置不变: ∣ A ∣ = ∣ A T ∣ |A|=|A^T| ∣A∣=∣AT∣ ;

  2. 数乘缩放: ∣ k A ∣ = k n ∣ A ∣ |kA|=k^n|A| ∣kA∣=kn∣A∣ (区别于"数乘行列式仅乘某一行/列");

  3. 和不分配: ∣ A + B ∣ ≠ ∣ A ∣ + ∣ B ∣ |A+B|\neq|A|+|B| ∣A+B∣=∣A∣+∣B∣ (如 A = E A=E A=E , B = − E B=-E B=−E , ∣ A + B ∣ = 0 |A+B|=0 ∣A+B∣=0 , ∣ A ∣ + ∣ B ∣ = 2 |A|+|B|=2 ∣A∣+∣B∣=2 );

  4. 乘积分配: ∣ A B ∣ = ∣ A ∣ ∣ B ∣ |AB|=|A||B| ∣AB∣=∣A∣∣B∣ (同阶方阵,可推广至有限个同阶方阵乘积);

  5. 非单射性: A ≠ O ⇏ ∣ A ∣ ≠ 0 A\neq O\nRightarrow|A|\neq0 A=O⇏∣A∣=0 , A ≠ B ⇏ ∣ A ∣ ≠ ∣ B ∣ A\neq B\nRightarrow|A|\neq|B| A=B⇏∣A∣=∣B∣ 。

三、特殊矩阵类型

矩阵类型 定义 核心性质
数量矩阵 k E kE kE (数 k k k 与单位矩阵的乘积) 与任意同阶矩阵可交换( k E A = A k E kEA=AkE kEA=AkE ),是"等比例缩放变换"的对应矩阵
对角矩阵 非主对角线元素均为0 记为 Λ = diag ( λ 1 , λ 2 , ⋯   , λ n ) \Lambda=\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n) Λ=diag(λ1,λ2,⋯,λn) ;乘法可简化为对角元素对应相乘;幂运算为对角元素分别取幂
上(下)三角矩阵 当 i > j i>j i>j ( i < j i<j i<j )时, a i j = 0 a_{ij}=0 aij=0 的矩阵 乘积仍为同类型三角矩阵;行列式为主对角线元素乘积;逆矩阵仍为同类型三角矩阵
对称矩阵 A T = A A^T=A AT=A ( a i j = a j i a_{ij}=a_{ji} aij=aji ) 对任意矩阵 A A A , A T A A^TA ATA 、 A A T AA^T AAT 均为对称矩阵;特征值均为实数
反对称矩阵 A T = − A A^T=-A AT=−A 主对角线元素为0( a i i = − a i i ⇒ a i i = 0 a_{ii}=-a_{ii}\Rightarrow a_{ii}=0 aii=−aii⇒aii=0 );奇数阶反对称矩阵的行列式为0
行/列矩阵 仅含一行/一列的矩阵 又称行/列向量;线性代数中向量默认为列向量;行矩阵转置为列矩阵
分块矩阵 用横线和纵线划分子块的矩阵 子块可视为元素参与运算;分块对角矩阵幂运算: ( A O O B ) n = ( A n O O B n ) \begin{pmatrix}A&O\\O&B\end{pmatrix}^n=\begin{pmatrix}A^n&O\\O&B^n\end{pmatrix} (AOOB)n=(AnOOBn)

实用结论 :判断矩阵是否为对称矩阵,只需验证 A T = A A^T=A AT=A 。例如 ( A A T ) T = ( A T ) T A T = A A T (AA^T)^T=(A^T)^TA^T=AA^T (AAT)T=(AT)TAT=AAT ,故 A A T AA^T AAT 必为对称矩阵。
分块矩阵乘法规则 :若 [ A B C D ] \begin{bmatrix}A & B \\C & D\end{bmatrix} [ACBD] 与 [ X Y Z W ] \begin{bmatrix}X & Y \\Z & W\end{bmatrix} [XZYW] 分块兼容(左矩阵列分块与右矩阵行分块一致),则:

A B C D \] \[ X Y Z W \] = \[ A X + B Z A Y + B W C X + D Z C Y + D W \] \\begin{bmatrix}A \& B \\\\C \& D\\end{bmatrix}\\begin{bmatrix}X \& Y \\\\Z \& W\\end{bmatrix}=\\begin{bmatrix}AX+BZ \& AY+BW \\\\CX+DZ \& CY+DW\\end{bmatrix} \[ACBD\]\[XZYW\]=\[AX+BZCX+DZAY+BWCY+DW

核心:左矩阵子块仍在左侧,右矩阵子块仍在右侧,子块乘法需满足"左列数=右行数"。

四、逆矩阵

4.1 定义

设 A A A 为 n n n 阶方阵,若存在 n n n 阶方阵 B B B ,使得:

A B = B A = E AB = BA = E AB=BA=E

则称 A A A 可逆 (或非奇异), B B B 为 A A A 的逆矩阵(逆矩阵唯一,记作 A − 1 A^{-1} A−1 );若不存在此类 B B B ,则称 A A A 不可逆(或奇异)。

A A A 与 A − 1 A^{-1} A−1 互为逆矩阵。

4.2 可逆判定(充要条件)

以下任一条件成立,均能判断矩阵是否可逆。

  1. ∣ A ∣ ≠ 0 |A| \neq 0 ∣A∣=0 (行列式非零);

  2. r ( A ) = n r(A)=n r(A)=n (满秩矩阵);

  3. A A A 可表示为有限个初等矩阵的乘积;

  4. A x = 0 Ax=0 Ax=0 仅有零解(齐次线性方程组只有零解)。

实用推论:若 n n n 阶矩阵 A , B , C A,B,C A,B,C 满足 A B C = E ABC=E ABC=E ,则 ∣ A ∣ ⋅ ∣ B ∣ ⋅ ∣ C ∣ = 1 |A|\cdot|B|\cdot|C|=1 ∣A∣⋅∣B∣⋅∣C∣=1 ,故 A , B , C A,B,C A,B,C 均可逆,且 A − 1 = B C A^{-1}=BC A−1=BC , C − 1 = A B C^{-1}=AB C−1=AB , B − 1 = C A B^{-1}=C A B−1=CA 。

4.3 核心性质

设 A , B A,B A,B 为同阶可逆方阵,则:

  1. 自反性: A − 1 A^{-1} A−1 可逆,且 ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A−1)−1=A ;

  2. 数乘可逆:若 k ≠ 0 k\neq0 k=0 ,则 k A kA kA 可逆,且 ( k A ) − 1 = 1 k A − 1 (kA)^{-1}=\frac{1}{k}A^{-1} (kA)−1=k1A−1 (推导: ( k A ) ( 1 k A − 1 ) = k ⋅ 1 k ⋅ A A − 1 = E (kA)(\frac{1}{k}A^{-1})=k\cdot\frac{1}{k}\cdot AA^{-1}=E (kA)(k1A−1)=k⋅k1⋅AA−1=E );

  3. 乘积反序: A B AB AB 可逆,且 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)−1=B−1A−1 (推广: ( A 1 A 2 ⋯ A k ) − 1 = A k − 1 ⋯ A 2 − 1 A 1 − 1 (A_1A_2\cdots A_k)^{-1}=A_k^{-1}\cdots A_2^{-1}A_1^{-1} (A1A2⋯Ak)−1=Ak−1⋯A2−1A1−1 );

  4. 转置可逆: A T A^T AT 可逆,且 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T (推导: ( A − 1 A ) T = E T = E ⇒ A T ( A − 1 ) T = E (A^{-1}A)^T=E^T=E\Rightarrow A^T(A^{-1})^T=E (A−1A)T=ET=E⇒AT(A−1)T=E );

  5. 行列式倒数: ∣ A − 1 ∣ = ∣ A ∣ − 1 = 1 ∣ A ∣ |A^{-1}|=|A|^{-1}=\frac{1}{|A|} ∣A−1∣=∣A∣−1=∣A∣1 (推导: ∣ A − 1 A ∣ = ∣ E ∣ = 1 ⇒ ∣ A − 1 ∣ ⋅ ∣ A ∣ = 1 |A^{-1}A|=|E|=1\Rightarrow |A^{-1}|\cdot|A|=1 ∣A−1A∣=∣E∣=1⇒∣A−1∣⋅∣A∣=1 )。

重要提醒: A , B A,B A,B 可逆 ⇏ A + B \nRightarrow A+B ⇏A+B 可逆;若追加条件" A − 1 + B − 1 A^{-1}+B^{-1} A−1+B−1 可逆",则 A + B A+B A+B 可逆,且 ( A + B ) − 1 = B − 1 ( B − 1 + A − 1 ) − 1 A − 1 (A+B)^{-1}=B^{-1}(B^{-1}+A^{-1})^{-1}A^{-1} (A+B)−1=B−1(B−1+A−1)−1A−1

4.4 逆矩阵的求法

4.4.1 定义法

核心原理 :若存在矩阵 B B B 满足 A B = B A = E AB=BA=E AB=BA=E ,则 B = A − 1 B=A^{-1} B=A−1 。

关键步骤

  1. 设逆矩阵 A − 1 A^{-1} A−1 的元素为未知数(如 2 阶矩阵设为 ( a b c d ) \begin{pmatrix}a&b\\c&d\end{pmatrix} (acbd) );

  2. 列矩阵乘法等式 A ⋅ A − 1 = E A\cdot A^{-1}=E A⋅A−1=E ,根据"矩阵相等则对应元素相等"列出方程组;

  3. 解方程组得未知元素,验证 A − 1 A = E A^{-1}A=E A−1A=E (保证正确性)。

适用场景:低阶矩阵(2 阶)、理论推导(需构造"待求逆矩阵×另一矩阵=E"形式)。

若 B , C B,C B,C 均可逆, A = B C A=BC A=BC,则 A A A 可逆,且 A − 1 = ( B C ) − 1 = C − 1 B − 1 A^{-1}=(BC)^{-1}=C^{-1}B^{-1} A−1=(BC)−1=C−1B−1 .

用定义求逆矩阵,需恒等变形关系式,可提取公因子化和差为乘积,成"待求逆矩阵×另一矩阵=E"的形式;也可先对两端取行列式,非零证可逆后再求逆。

4.4.2 伴随矩阵法

核心原理 : A − 1 = 1 ∣ A ∣ A ∗ A^{-1}=\frac{1}{|A|}A^* A−1=∣A∣1A∗ ( A ∗ A^* A∗ 为伴随矩阵)。

关键步骤

  1. 计算 ∣ A ∣ |A| ∣A∣ ,判断可逆性( ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0 则可逆);

  2. 求所有元素的代数余子式: A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij ( M i j M_{ij} Mij 为余子式,即去掉第 i i i 行第 j j j 列后的 n − 1 n-1 n−1 阶行列式);

  3. 构造伴随矩阵: A ∗ A^* A∗ 是代数余子式矩阵的转置;

  4. 代入公式得 A − 1 A^{-1} A−1 。

特点 :步骤固定,适用于 2-3 阶矩阵;高阶矩阵计算量剧增(需计算 n 2 n^2 n2 个代数余子式)。

4.4.3 初等变换法(核心方法)

核心原理 :对增广矩阵 ( A ∣ E ) (A|E) (A∣E) 作初等行变换,当左侧 A A A 化为 E E E 时,右侧 E E E 同步化为 A − 1 A^{-1} A−1 ;列变换同理。
( A ∣ E ) → 初等行变换 ( E ∣ A − 1 ) ( A E ) → 初等列变换 ( E A − 1 ) (A|E) \xrightarrow{\text{初等行变换}} (E|A^{-1}) \\ \begin{pmatrix}A\\E\end{pmatrix} \xrightarrow{\text{初等列变换}}\begin{pmatrix}E\\A^{-1}\end{pmatrix} (A∣E)初等行变换 (E∣A−1)(AE)初等列变换 (EA−1)
关键步骤

  1. 构造 n × 2 n n\times2n n×2n 增广矩阵 ( A ∣ E ) (A|E) (A∣E) ;

  2. 作初等行变换(行交换、行缩放、行倍加),将左侧 A A A 化为 E E E ;

  3. 右侧矩阵即为 A − 1 A^{-1} A−1 。

特点:流程化操作,计算量小、效率高,适用于高阶矩阵(4 阶及以上)和工程实际计算。

4.5 分块矩阵的逆

4.5.1 对角分块矩阵

逆矩阵仍为对角分块,主对角子块分别取逆:
( A O O B ) − 1 = ( A − 1 O O B − 1 ) , ( A 1 O ⋱ O A k ) − 1 = ( A 1 − 1 O ⋱ O A k − 1 ) \begin{gather*} \begin{pmatrix} A & O \\ O & B \end{pmatrix}^{-1} = \begin{pmatrix} A^{-1} & O \\ O & B^{-1} \end{pmatrix}, \quad \begin{pmatrix} A_1 & & O \\ & \ddots & \\ O & & A_k \end{pmatrix}^{-1}= \begin{pmatrix} A_1^{-1} & & O \\ & \ddots & \\ O & & A_k^{-1} \end{pmatrix} \end{gather*} (AOOB)−1=(A−1OOB−1), A1O⋱OAk −1= A1−1O⋱OAk−1

4.5.2 反对角分块矩阵

逆矩阵仍为反对角分块,子块取逆后交换位置:
( O A B O ) − 1 = ( O B − 1 A − 1 O ) , ( O A 1 ⋱ A k O ) − 1 = ( O A k − 1 ⋱ A 1 − 1 O ) \begin{gather*} \begin{pmatrix} O & A \\ B & O \end{pmatrix}^{-1} = \begin{pmatrix} O & B^{-1} \\ A^{-1} & O \end{pmatrix}, \quad \begin{pmatrix} O & & A_1 \\ & \ddots & \\ A_k & & O \end{pmatrix}^{-1}= \begin{pmatrix} O & & A_k^{-1} \\ & \ddots & \\ A_1^{-1} & & O \end{pmatrix} \end{gather*} (OBAO)−1=(OA−1B−1O), OAk⋱A1O −1= OA1−1⋱Ak−1O

4.5.3 三角分块矩阵

逆矩阵仍为同类型三角分块,零子块位置不变,非零非主对角块按以下公式计算:
( A B O D ) − 1 = ( A − 1 − A − 1 B D − 1 O D − 1 ) , ( A O C D ) − 1 = ( A − 1 O − D − 1 C A − 1 D − 1 ) ( O B C D ) − 1 = ( − C − 1 D B − 1 C − 1 B − 1 O ) , ( A B C O ) − 1 = ( O C − 1 B − 1 − B − 1 A C − 1 ) \begin{gather*} \begin{pmatrix} A & B \\ O & D \end{pmatrix}^{-1}= \begin{pmatrix} A^{-1} & -A^{-1}BD^{-1} \\ O & D^{-1} \end{pmatrix}, \quad \begin{pmatrix} A & O \\ C & D \end{pmatrix}^{-1}= \begin{pmatrix} A^{-1} & O \\ -D^{-1}CA^{-1} & D^{-1} \end{pmatrix} \\ \begin{pmatrix} O & B \\ C & D \end{pmatrix}^{-1}= \begin{pmatrix} -C^{-1}DB^{-1} & C^{-1} \\ B^{-1} & O \end{pmatrix}, \quad \begin{pmatrix} A & B \\ C & O \end{pmatrix}^{-1}= \begin{pmatrix} O & C^{-1} \\ B^{-1} & -B^{-1}AC^{-1} \end{pmatrix} \end{gather*} (AOBD)−1=(A−1O−A−1BD−1D−1),(ACOD)−1=(A−1−D−1CA−1OD−1)(OCBD)−1=(−C−1DB−1B−1C−1O),(ACBO)−1=(OB−1C−1−B−1AC−1)

记忆技巧:非主对角块 = -(主对角块逆 × 原非主对角块 × 另一主对角块逆)。即 "左乘同行,右乘同列,再添负号" 。

五、伴随矩阵

5.1 定义

n n n 阶方阵 A A A 的伴随矩阵 A ∗ A^* A∗ 是代数余子式矩阵的转置:
A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) A^* = \begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \end{pmatrix} A∗= A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann

其中 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij ( M i j M_{ij} Mij 为 a i j a_{ij} aij 的余子式)。

5.2 核心性质

  1. 基础恒等式: A A ∗ = A ∗ A = ∣ A ∣ E AA^*=A^*A=|A|E AA∗=A∗A=∣A∣E, 故 A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1;

  2. 行列式: ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*|=|A|^{n-1} ∣A∗∣=∣A∣n−1( n ≥ 2 n\geq2 n≥2);

    证:由 A A ∗ = ∣ A ∣ E n AA^*=|A|E_n AA∗=∣A∣En,两边取行列式得 ∣ A A ∗ ∣ = ∣ A ∣ ∣ A ∗ ∣ = ∣ ∣ A ∣ E n ∣ = ∣ A ∣ n |AA^*|=|A||A^*|=||A|E_n|=|A|^n ∣AA∗∣=∣A∣∣A∗∣=∣∣A∣En∣=∣A∣n。

    • 若 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0,则 ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*|=|A|^{n-1} ∣A∗∣=∣A∣n−1;

    • 若 ∣ A ∣ = 0 |A|=0 ∣A∣=0,

      当 A = O A=O A=O 时, A ∗ = O A^*=O A∗=O,显然 ∣ A ∗ ∣ = 0 = ∣ A ∣ n − 1 |A^*|=0=|A|^{n-1} ∣A∗∣=0=∣A∣n−1;

      当 A ≠ O A\neq O A=O 时,若 ∣ A ∗ ∣ ≠ 0 |A^*|\neq0 ∣A∗∣=0,则 A ∗ A^* A∗ 可逆,由 A A ∗ = O AA^*=O AA∗=O 两边右侧乘 ( A ∗ ) − 1 (A^*)^{-1} (A∗)−1得 A = O A=O A=O,矛盾,故 ∣ A ∗ ∣ = 0 = ∣ A ∣ n − 1 |A^*|=0=|A|^{n-1} ∣A∗∣=0=∣A∣n−1。

    综上, ∣ A ∗ ∣ = ∣ A ∣ n − 1 \vert A^*\vert=\vert A\vert^{n - 1} ∣A∗∣=∣A∣n−1。

  3. 数乘伴随: ( k A ) ∗ = k n − 1 A ∗ (kA)^*=k^{n-1}A^* (kA)∗=kn−1A∗( n ≥ 2 n\geq2 n≥2);

  4. 转置/逆伴随: ( A T ) ∗ = ( A ∗ ) T (A^T)^*=(A^*)^T (AT)∗=(A∗)T, ( A − 1 ) ∗ = ( A ∗ ) − 1 = 1 ∣ A ∣ A (A^{-1})^*=(A^*)^{-1}=\frac{1}{|A|}A (A−1)∗=(A∗)−1=∣A∣1A;

  5. 乘积伴随: ( A B ) ∗ = B ∗ A ∗ (AB)^*=B^*A^* (AB)∗=B∗A∗(同阶方阵);

  6. 伴随的伴随: ( A ∗ ) ∗ = ∣ A ∣ n − 2 A (A^*)^*=|A|^{n-2}A (A∗)∗=∣A∣n−2A( n ≥ 2 n\geq2 n≥2)。

其实,当 A , B A,B A,B 不可逆时, ∣ A ∗ ∣ = ∣ A ∣ n − 1 , ( A B ) ∗ = B ∗ A ∗ |A^*|=|A|^{n-1},(AB)^*=B^*A^* ∣A∗∣=∣A∣n−1,(AB)∗=B∗A∗ 仍然成立。

易混易错点:

  • ( A + B ) ∗ ≠ A ∗ + B ∗ (A+B)^*\neq A^*+B^* (A+B)∗=A∗+B∗ , ( A + B ) − 1 ≠ A − 1 + B − 1 (A+B)^{-1}\neq A^{-1}+B^{-1} (A+B)−1=A−1+B−1 ;
  • ∣ A + B ∣ ≠ ∣ A ∣ + ∣ B ∣ |A+B|\neq|A|+|B| ∣A+B∣=∣A∣+∣B∣ ,仅转置满足 ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT 。

5.3 伴随矩阵的求法

5.3.1 定义法(通用)

核心逻辑:先算代数余子式,再转置。

具体步骤

  1. 求余子式 M i j M_{ij} Mij :去掉第 i i i 行第 j j j 列,计算剩余元素的 n − 1 n-1 n−1 阶行列式;

  2. 求代数余子式 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij ;

  3. 构造代数余子式矩阵,转置得 A ∗ A^* A∗ 。

5.3.2 公式法(仅可逆矩阵)

核心逻辑 :利用 A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1,前提是矩阵行列式 ∣ A ∣ ≠ 0 |A| \neq 0 ∣A∣=0(即矩阵可逆)。

具体步骤

  1. 验证可逆:计算 ∣ A ∣ |A| ∣A∣,确认 ∣ A ∣ ≠ 0 |A| \neq 0 ∣A∣=0(若为 0,此方法失效)。
  2. 求逆矩阵 A − 1 A^{-1} A−1:用初等变换法等求出 A − 1 A^{-1} A−1。
  3. 数乘得 A ∗ A^* A∗:将 ∣ A ∣ |A| ∣A∣与 A − 1 A^{-1} A−1作数乘(矩阵每个元素乘 ∣ A ∣ |A| ∣A∣),结果即为 A ∗ A^* A∗。

六、初等变换与初等矩阵

高等数学中,初等函数由基本初等函数(常函数、三角函数、幂函数、对数函数、指数函数、反三角函数)经有限次四则运算或函数复合构成。类似的,代数学里的初等变换以三种基本初等变换为基础。

6.1 矩阵的初等变换

分为行变换 (记 r r r )和列变换 (记 c c c ),共三类:

变换类型 行变换记法 列变换记法
互换 r i ↔ r j r_i\leftrightarrow r_j ri↔rj c i ↔ c j c_i\leftrightarrow c_j ci↔cj
数乘( k ≠ 0 k\neq0 k=0) k r i kr_i kri k c i kc_i kci
倍加 r i + k r j r_i+kr_j ri+krj c i + k c j c_i+kc_j ci+kcj

变换使用规则:

  • 求矩阵的秩:行、列变换可混用(不改变秩);

  • 求逆矩阵:仅用行变换或仅用列变换(不可混用);

  • 解线性方程组:只能用行变换(保证方程组同解)。

6.2 初等矩阵的定义

由单位矩阵经一次初等变换得到的矩阵,称为初等矩阵(三种初等变换对应三种初等矩阵)。以 3 阶矩阵为例:

  • 互换型: E i j E_{ij} Eij (交换第 i , j i,j i,j 行/列),如 E 12 = ( 0 1 0 1 0 0 0 0 1 ) E_{12}=\begin{pmatrix}0&1&0\\1&0&0\\0&0&1\end{pmatrix} E12= 010100001 ;

  • 数乘型: E i ( k ) E_i(k) Ei(k) (第 i i i 行/列乘非零常数 k k k ),如 E 2 ( 3 ) = ( 1 0 0 0 3 0 0 0 1 ) E_2(3)=\begin{pmatrix}1&0&0\\0&3&0\\0&0&1\end{pmatrix} E2(3)= 100030001 ;

  • 倍加型: E i j ( k ) E_{ij}(k) Eij(k) ("第 j j j 行的 k k k 倍加到第 i i i 行"或"第 i 列的 k 倍加到第 j 列"),如 E 12 ( 2 ) = ( 1 2 0 0 1 0 0 0 1 ) E_{12}(2)=\begin{pmatrix}1&2&0\\0&1&0\\0&0&1\end{pmatrix} E12(2)= 100210001

核心规律(左行右列)

  • 对矩阵 A A A 作初等行变换 ⇔ \Leftrightarrow ⇔ 在 A A A 左侧乘对应初等矩阵;

  • 对矩阵 A A A 作初等列变换 ⇔ \Leftrightarrow ⇔ 在 A A A 右侧乘对应初等矩阵。

示例: E 12 A E_{12}A E12A 等价于交换 A A A 的第 1、2 行; A E 12 AE_{12} AE12 等价于交换 A A A 的第 1、2 列。

设 A = [ a i j ] A=[a_{ij}] A=[aij] 是 n 阶矩阵, Λ = diag ( λ 1 , λ 2 , ... , λ n ) \Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n) Λ=diag(λ1,λ2,...,λn) ,则 A Λ = [ λ j a i j ] , Λ A = [ λ i a i j ] A\Lambda=[\lambda_ja_{ij}],\Lambda A=[\lambda_ia_{ij}] AΛ=[λjaij],ΛA=[λiaij] .

6.3 初等矩阵的性质与重要公式

  1. 转置特性

    • E i j T = E i j E_{ij}^T=E_{ij} EijT=Eij , E i T ( k ) = E i ( k ) E_i^T(k)=E_i(k) EiT(k)=Ei(k) ;

    • E i j T ( k ) = E j i ( k ) E_{ij}^T(k)=E_{ji}(k) EijT(k)=Eji(k) (倍加型转置后下标交换)。

  2. 可逆性

    三种初等矩阵行列式均非零( ∣ E i ( k ) ∣ = k ≠ 0 |E_i(k)|=k\neq0 ∣Ei(k)∣=k=0、 ∣ E i j ∣ = − 1 |E_{ij}|=-1 ∣Eij∣=−1、 ∣ E i j ( k ) ∣ = 1 |E_{ij}(k)|=1 ∣Eij(k)∣=1),故均可逆,且逆矩阵仍为同类初等矩阵。由于初等矩阵与初等变换一一对应,其逆矩阵本质是 "抵消原变换效果" 的逆变换所对应的初等矩阵,具体如下:

    • E i j − 1 = E i j E_{ij}^{-1}=E_{ij} Eij−1=Eij (交换两次还原);

    • E i ( k ) − 1 = E i ( 1 k ) E_i(k)^{-1}=E_i\left(\frac{1}{k}\right) Ei(k)−1=Ei(k1) (乘 1 k \frac{1}{k} k1 抵消数乘);

    • E i j ( k ) − 1 = E i j ( − k ) E_{ij}(k)^{-1}=E_{ij}(-k) Eij(k)−1=Eij(−k) (加 − k -k −k 倍抵消倍加)。

  3. 可逆矩阵与初等矩阵的关系

    • 充要条件:矩阵 A A A 可逆 ⇔ A \Leftrightarrow A ⇔A 可表示为有限个初等矩阵的乘积( A = P 1 P 2 ⋯ P m A=P_1P_2\cdots P_m A=P1P2⋯Pm );

    • 几何意义: A α = P 1 P 2 ⋯ P m α A\alpha = P_1P_2\cdots P_m\alpha Aα=P1P2⋯Pmα 表示向量 α \alpha α 经一系列初等变换(旋转、缩放、剪切)得到新向量

    • 逆矩阵求解原理:若 A A A 可逆,则存在初等矩阵 Q 1 , ... , Q m Q_1,\dots,Q_m Q1,...,Qm 使得 Q m ⋯ Q 1 A = E Q_m\cdots Q_1A=E Qm⋯Q1A=E ,故 Q m ⋯ Q 1 E = A − 1 Q_m\cdots Q_1E=A^{-1} Qm⋯Q1E=A−1 (即初等行变换求逆的核心逻辑)。列变换同理。

    上述关系既揭示了可逆矩阵的结构本质(由初等变换 "搭建" 而成),也提供了可逆性判定与逆矩阵求解的具体方法,是线性代数中连接矩阵变换与运算的关键桥梁。

6.4 行阶梯形矩阵与行最简阶梯型矩阵

6.4.1 行阶梯形矩阵(Row Echelon Form, REF)

初等行变换得到,是求秩、解方程组的基础,需满足 2 个条件:

  • 条件 1:全零行(元素全为 0 的行)全部集中在矩阵下方;

  • 条件 2:非零行的首个非零元素(主元),列标从上行到下行严格递增(下一行主元更靠右);

补充说明:REF 的主元可不为 1,主元所在列也可包含非零元素,且同一矩阵的 REF 不唯一。

示例: ( 1 2 3 0 2 2 0 0 0 ) \begin{pmatrix} 1 & 2 & 3 \\ 0 & 2 & 2 \\ 0 & 0 & 0 \end{pmatrix} 100220320

6.4.2 行最简阶梯型矩阵(Reduced REF, RREF)

REF 的特殊形式,额外满足 2 个 "最简" 条件:

  • 条件 3:非零行主元均为 1(单位主元);

  • 条件 4:主元所在列的其他元素均为0(主元列是 "标准单位列")。

补充说明:同一矩阵的 RREF 唯一;可逆矩阵的 RREF 必为同阶单位矩阵 E E E(呼应可逆矩阵可经初等行变换化为 E E E 的性质)。

示例: ( 1 0 1 0 1 1 0 0 0 ) \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \end{pmatrix} 100010110

七、矩阵方程

7.1 常见形式与求解核心

矩阵方程是含未知矩阵的等式,核心形式及解法如下( A , B , C A,B,C A,B,C 已知, X X X 未知):

方程形式 求解条件 解法
A X = B AX=B AX=B A A A 可逆 X = A − 1 B X=A^{-1}B X=A−1B (初等行变换: [ A ∣ B ] → 行变换 [ E ∣ A − 1 B ] [A|B]\xrightarrow{\text{行变换}}[E|A^{-1}B] [A∣B]行变换 [E∣A−1B] )
X A = B XA=B XA=B A A A 可逆 X = B A − 1 X=BA^{-1} X=BA−1 (初等列变换: ( A B ) → 列变换 ( E B A − 1 ) \begin{pmatrix}A\\B\end{pmatrix}\xrightarrow{\text{列变换}}\begin{pmatrix}E\\BA^{-1}\end{pmatrix} (AB)列变换 (EBA−1) )
A X C = B AXC=B AXC=B A , C A,C A,C 可逆 X = A − 1 B C − 1 X=A^{-1}BC^{-1} X=A−1BC−1 (先求 A − 1 B A^{-1}B A−1B ,再求 ( A − 1 B ) C − 1 (A^{-1}B)C^{-1} (A−1B)C−1 )

计算技巧:可通过初等变换直接求结果,无需单独算逆矩阵。例如求 A − 1 B A^{-1}B A−1B,对增广矩阵 [ A ∣ B ] [A|B] [A∣B] 做初等行变换,当 A A A 变为单位矩阵时, B B B 变为 A − 1 B A^{-1}B A−1B;求 B C − 1 BC^{-1} BC−1 可用初等列变换。

7.2 实例演示

已知 A = ( 1 2 3 4 ) A=\begin{pmatrix}1&2\\3&4\end{pmatrix} A=(1324) , C = ( 1 0 0 2 ) C=\begin{pmatrix}1&0\\0&2\end{pmatrix} C=(1002) , B = ( 3 1 2 4 ) B=\begin{pmatrix}3&1\\2&4\end{pmatrix} B=(3214) ,求解 A X C = B AXC=B AXC=B :

方法一:直接求逆法

  1. 求 A − 1 A^{-1} A−1 : A − 1 = ( − 2 1 3 2 − 1 2 ) A^{-1} = \begin{pmatrix} -2 & 1 \\ \frac{3}{2} & -\frac{1}{2} \end{pmatrix} A−1=(−2231−21);
  2. 求 C − 1 C^{-1} C−1 :对角矩阵逆为 "对角元素取倒数",得 C − 1 = ( 1 0 0 1 2 ) C^{-1} = \begin{pmatrix} 1 & 0 \\ 0 & \frac{1}{2} \end{pmatrix} C−1=(10021);
  3. 计算 X X X : X = A − 1 B C − 1 = ( − 2 1 3 2 − 1 2 ) ( 3 1 2 4 ) ( 1 0 0 1 2 ) = ( − 4 1 7 2 − 1 4 ) X = A^{-1}BC^{-1} = \begin{pmatrix} -2 & 1 \\ \frac{3}{2} & -\frac{1}{2} \end{pmatrix}\begin{pmatrix} 3 & 1 \\ 2 & 4 \end{pmatrix}\begin{pmatrix} 1 & 0 \\ 0 & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} -4 & 1 \\ \frac{7}{2} & -\frac{1}{4} \end{pmatrix} X=A−1BC−1=(−2231−21)(3214)(10021)=(−4271−41)。

方法二:初等变换法(推荐)

  1. 初等行变换求 A − 1 B A^{-1}B A−1B :

    构造 [ A ∣ B ] = ( 1 2 3 1 3 4 2 4 ) [A|B]=\left(\begin{array}{cc|cc}1&2&3&1\\3&4&2&4\end{array}\right) [A∣B]=(13243214) ,经 r 2 − 3 r 1 r_2-3r_1 r2−3r1 、 r 2 × ( − 1 2 ) r_2\times(-\frac{1}{2}) r2×(−21) 、 r 1 − 2 r 2 r_1-2r_2 r1−2r2 得 ( 1 0 − 4 2 0 1 7 2 − 1 2 ) \left(\begin{array}{cc|cc}1&0&-4&2\\0&1&\frac{7}{2}&-\frac{1}{2}\end{array}\right) (1001−4272−21)

    即 A − 1 B = ( − 4 2 7 2 − 1 2 ) A^{-1}B=\begin{pmatrix}-4&2\\\frac{7}{2}&-\frac{1}{2}\end{pmatrix} A−1B=(−4272−21) ;

  2. 列变换求 ( A − 1 B ) C − 1 (A^{-1}B)C^{-1} (A−1B)C−1:

    构造 ( C A − 1 B ) = ( 1 0 0 2 − 4 2 7 2 − 1 2 ) \begin{pmatrix} C \\ A^{-1}B \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 2 \\ -4 & 2 \\ \frac{7}{2} & -\frac{1}{2} \end{pmatrix} (CA−1B)= 10−427022−21 ,经 c 2 × 1 2 c_2\times\frac{1}{2} c2×21,得 ( 1 0 0 1 − 4 1 7 2 − 1 4 ) \begin{pmatrix} 1 & 0 \\ 0 & 1 \\ -4 & 1 \\ \frac{7}{2} & -\frac{1}{4} \end{pmatrix} 10−427011−41

    即 X = ( − 4 1 7 2 − 1 4 ) X = \begin{pmatrix} -4 & 1 \\ \frac{7}{2} & -\frac{1}{4} \end{pmatrix} X=(−4271−41)。

八、等价矩阵

8.1 定义

设 A , B A,B A,B 为 m × n m\times n m×n 矩阵,若存在可逆矩阵 P m × m P_{m\times m} Pm×m 、 Q n × n Q_{n\times n} Qn×n ,使得 P A Q = B PAQ=B PAQ=B ,则称 A A A 与 B B B 等价,记为 A ≅ B A\cong B A≅B 。

8.2 等价标准形

任意矩阵可经初等变换化为唯一的等价标准形:

( E r O O O ) \begin{pmatrix}E_r&O\\O&O\end{pmatrix} (ErOOO)

其中 r = r ( A ) r=r(A) r=r(A) (矩阵的秩),即存在可逆矩阵 P , Q P,Q P,Q 使得 P A Q = ( E r O O O ) PAQ=\begin{pmatrix}E_r&O\\O&O\end{pmatrix} PAQ=(ErOOO) 。

8.3 等价判定(充要条件)

m × n m\times n m×n 矩阵 A A A 与 B B B 等价,满足以下任一条件均可判定:

  1. r ( A ) = r ( B ) r(A)=r(B) r(A)=r(B) ;

  2. A A A 经有限次初等变换可化为 B B B ;

  3. A A A 与 B B B 有相同的等价标准形。

8.4 性质

  • 反身性: A ≅ A A\cong A A≅A ;

  • 对称性: A ≅ B ⇒ B ≅ A A\cong B\Rightarrow B\cong A A≅B⇒B≅A ;

  • 传递性: A ≅ B A\cong B A≅B 且 B ≅ C ⇒ A ≅ C B\cong C\Rightarrow A\cong C B≅C⇒A≅C 。

九、矩阵的秩

9.1 定义

  1. 子式 :在 m × n m\times n m×n 矩阵 A A A 中,任取 k k k 行 k k k 列( 1 ≤ k ≤ min ⁡ ( m , n ) 1\leq k\leq\min(m,n) 1≤k≤min(m,n) ),交叉处元素构成的 k k k 阶行列式,称为 A A A 的 k k k 阶子式。

  2. 矩阵的秩 : A A A 中所有非零子式的最高阶数,记为 r ( A ) r(A) r(A) 或 r a n k ( A ) rank(A) rank(A)(零矩阵的秩为 0)。

等价表述 : r ( A ) = k ⇔ A r(A)=k \Leftrightarrow A r(A)=k⇔A 存在 k k k 个线性无关的行/列向量,且任意 k + 1 k+1 k+1 个行/列向量线性相关。

方阵的特殊关系 : n n n 阶方阵 A A A 满秩( r ( A ) = n r(A)=n r(A)=n ) ⇔ ∣ A ∣ ≠ 0 ⇔ A \Leftrightarrow |A|\neq0 \Leftrightarrow A ⇔∣A∣=0⇔A 可逆(满秩与可逆等价);非方阵无"可逆"概念,仅可讨论满秩( r ( A ) = min ⁡ ( m , n ) r(A)=\min(m,n) r(A)=min(m,n) )。

示例 :求 A = ( 1 2 3 2 4 6 3 5 7 ) A=\begin{pmatrix}1&2&3\\2&4&6\\3&5&7\end{pmatrix} A= 123245367 的秩

  • 1 阶子式:存在非零元素(如 1),故有 1 阶非零子式;
  • 2 阶子式: ∣ 1 2 3 5 ∣ = − 1 ≠ 0 \begin{vmatrix}1&2\\3&5\end{vmatrix}=-1\neq0 1325 =−1=0,故有 2 阶非零子式;
  • 3 阶子式: ∣ A ∣ = 0 |A|=0 ∣A∣=0,无 3 阶非零子式。

结论: r ( A ) = 2 r(A)=2 r(A)=2。

9.2 核心性质

性质 公式/说明
范围约束 0 ≤ r ( A m × n ) ≤ min ⁡ ( m , n ) 0\leq r(A_{m\times n})\leq\min(m,n) 0≤r(Am×n)≤min(m,n)
数乘不变 r ( k A ) = r ( A ) r(kA)=r(A) r(kA)=r(A) ( k ≠ 0 k\neq0 k=0 )
转置不变 r ( A ) = r ( A T ) = r ( A A T ) = r ( A T A ) r(A)=r(A^T)=r(AA^T)=r(A^TA) r(A)=r(AT)=r(AAT)=r(ATA)。若 r ( A ) = r ( [ A ∣ B ] ) r(A)=r([A|B]) r(A)=r([A∣B]) ,则 r ( A T ) = r ( ( A T B T ) ) r(A^T)=r(\begin{pmatrix}A^T\\B^T\end{pmatrix}) r(AT)=r((ATBT)) .
等价不变 A ≅ B ⇒ r ( A ) = r ( B ) A\cong B\Rightarrow r(A)=r(B) A≅B⇒r(A)=r(B)
伴随矩阵秩 r ( A ∗ ) = { n , r ( A ) = n 1 , r ( A ) = n − 1 0 , r ( A ) ≤ n − 2 r(A^*)=\begin{cases}n, & r(A)=n\\1, & r(A)=n-1\\0, & r(A)\leq n-2\end{cases} r(A∗)=⎩ ⎨ ⎧n,1,0,r(A)=nr(A)=n−1r(A)≤n−2 ( n ≥ 2 n\geq2 n≥2 )
可逆乘积不变 P , Q P,Q P,Q 可逆 ⇒ r ( P A Q ) = r ( P A ) = r ( A Q ) = r ( A ) \Rightarrow r(PAQ)=r(PA)=r(AQ)=r(A) ⇒r(PAQ)=r(PA)=r(AQ)=r(A)
和的秩约束 r ( A + B ) ≤ r ( A ) + r ( B ) r(A+B)\leq r(A)+r(B) r(A+B)≤r(A)+r(B)
积的秩约束 r ( A B ) ≤ min ⁡ ( r ( A ) , r ( B ) ) r(AB)\leq\min(r(A),r(B)) r(AB)≤min(r(A),r(B))
零积不等式 A B = O ⇒ r ( A ) + r ( B ) ≤ n AB=O\Rightarrow r(A)+r(B)\leq n AB=O⇒r(A)+r(B)≤n ( A m × n , B n × l A_{m\times n},B_{n\times l} Am×n,Bn×l , B B B 的列向量是 A x = 0 Ax=0 Ax=0 的解,从而 r ( B ) ≤ n − r ( A ) r(B)\leq n-r(A) r(B)≤n−r(A) )
西尔维斯特不等式 r ( A B ) ≥ r ( A ) + r ( B ) − n r(AB)\geq r(A)+r(B)-n r(AB)≥r(A)+r(B)−n ( A m × n , B n × l A_{m\times n},B_{n\times l} Am×n,Bn×l )

伴随矩阵秩的证明

  • r ( A ) = n r(A)=n r(A)=n (满秩): A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1 ,故 r ( A ∗ ) = n r(A^*)=n r(A∗)=n ;

  • r ( A ) = n − 1 r(A)=n-1 r(A)=n−1 : A A A 存在非零 n − 1 n-1 n−1 阶子式( A ∗ ≠ O A^*\neq O A∗=O , r ( A ∗ ) ≥ 1 r(A^*)\geq1 r(A∗)≥1 ),且 A A ∗ = ∣ A ∣ E = O AA^*=|A|E=O AA∗=∣A∣E=O ( r ( A ) + r ( A ∗ ) ≤ n r(A)+r(A^*)\leq n r(A)+r(A∗)≤n ,故 r ( A ∗ ) ≤ 1 r(A^*)\leq1 r(A∗)≤1 ),因此 r ( A ∗ ) = 1 r(A^*)=1 r(A∗)=1 ;

  • r ( A ) ≤ n − 2 r(A)\leq n-2 r(A)≤n−2 : A A A 的所有 n − 1 n-1 n−1 阶子式为 0( A ∗ = O A^*=O A∗=O ),故 r ( A ∗ ) = 0 r(A^*)=0 r(A∗)=0 。

9.3 求法

方法 步骤 适用场景
定义法 依次计算 1 阶、2 阶...子式,找到最高阶非零子式的阶数 2-3 阶低阶矩阵
初等行变换法 将矩阵化为行阶梯形,非零行的行数即为秩(核心方法) 所有矩阵(尤其是高阶)

示例:求 A = ( 1 2 3 4 2 4 6 8 3 5 7 9 ) A=\begin{pmatrix}1&2&3&4\\2&4&6&8\\3&5&7&9\end{pmatrix} A= 123245367489 的秩

行变换操作: r 2 − 2 r 1 , r 3 − 3 r 1 r_2 - 2r_1,r_3 - 3r_1 r2−2r1,r3−3r1,得: ( 1 2 3 4 0 0 0 0 0 − 1 − 2 − 3 ) \begin{pmatrix}1&2&3&4\\0&0&0&0\\0&-1&-2&-3\end{pmatrix} 10020−130−240−3 ;

交换第二、三行( r 2 ↔ r 3 r_2\leftrightarrow r_3 r2↔r3),得行阶梯形: ( 1 2 3 4 0 − 1 − 2 − 3 0 0 0 0 ) \begin{pmatrix}1&2&3&4\\0&-1&-2&-3\\0&0&0&0\end{pmatrix} 1002−103−204−30 。

结论:非零行数为 2,故 r ( A ) = 2 r(A)=2 r(A)=2。

9.4 秩的关系证明

  1. 证 r ( A ) ≤ r ( B ) r(A) \leq r(B) r(A)≤r(B) :证明 A A A 的行/列向量组可由 B B B 的行/列向量组线性表示;

  2. 证 r ( A ) = r ( B ) r(A) = r(B) r(A)=r(B) :

    • 夹逼法:通过秩的不等式链双向约束(如 a ≤ r ( A ) ≤ r ( B ) ≤ a a\leq r(A)\leq r(B)\leq a a≤r(A)≤r(B)≤a );

    • 同解法:证明 A x = 0 Ax=0 Ax=0 与 B x = 0 Bx=0 Bx=0 同解(同解方程组的解空间维数相同,维数 = n − r =n - r =n−r ),可直接得 r ( A ) = r ( B ) r(A) = r(B) r(A)=r(B)。

相关推荐
一条大祥脚10 小时前
26.1.2 两个数的数位dp 分段快速幂 dp预处理矩阵系数
线性代数·矩阵
ID_1800790547313 小时前
小红书笔记详情API接口基础解析:数据结构与调用方式
数据结构·数据库·笔记
北岛寒沫19 小时前
北京大学国家发展研究院 经济学原理课程笔记(第二十一课 金融学基础)
经验分享·笔记·学习
优雅的潮叭19 小时前
c++ 学习笔记之 malloc
c++·笔记·学习
李派森21 小时前
软考高项(信息系统项目管理师)—第4章 信息系统管理全解析
笔记·计算机网络
byzh_rc1 天前
[认知计算] 专栏总结
线性代数·算法·matlab·信号处理
浩瀚地学1 天前
【Java】常用API(二)
java·开发语言·经验分享·笔记·学习
元亓亓亓1 天前
考研408--组成原理--day15--I/O方式
考研·i/o·408·组成原理
今儿敲了吗1 天前
C++概述
c++·笔记