Part 2 矩阵 - 技术栈

文章目录

一、矩阵的本质
- [1.1 线性变换视角](#1.1 线性变换视角)
- [1.2 数据组织视角](#1.2 数据组织视角)
- [1.3 矩阵的核心特征与变换本质](#1.3 矩阵的核心特征与变换本质)
- [1.4 核心关联：秩与行列式](#1.4 核心关联：秩与行列式)
二、矩阵的定义与基本运算
- [2.1 矩阵的定义](#2.1 矩阵的定义)
- [2.2 矩阵的基本运算](#2.2 矩阵的基本运算)
- - [2.2.1 相等](#2.2.1 相等)
  - [2.2.2 矩阵加法](#2.2.2 矩阵加法)
  - [2.2.3 数与矩阵的乘法（数乘）](#2.2.3 数与矩阵的乘法（数乘）)
  - [2.2.4 矩阵乘法](#2.2.4 矩阵乘法)
  - [2.2.5 转置运算](#2.2.5 转置运算)
  - [2.2.6 方阵的幂运算](#2.2.6 方阵的幂运算)
  - [2.2.7 方阵的行列式](#2.2.7 方阵的行列式)
三、特殊矩阵类型
四、逆矩阵
- [4.1 定义](#4.1 定义)
- [4.2 可逆判定（充要条件）](#4.2 可逆判定（充要条件）)
- [4.3 核心性质](#4.3 核心性质)
- [4.4 逆矩阵的求法](#4.4 逆矩阵的求法)
- - [4.4.1 定义法](#4.4.1 定义法)
  - [4.4.2 伴随矩阵法](#4.4.2 伴随矩阵法)
  - [4.4.3 初等变换法（核心方法）](#4.4.3 初等变换法（核心方法）)
- [4.5 分块矩阵的逆](#4.5 分块矩阵的逆)
- - [4.5.1 对角分块矩阵](#4.5.1 对角分块矩阵)
  - [4.5.2 反对角分块矩阵](#4.5.2 反对角分块矩阵)
  - [4.5.3 三角分块矩阵](#4.5.3 三角分块矩阵)
五、伴随矩阵
- [5.1 定义](#5.1 定义)
- [5.2 核心性质](#5.2 核心性质)
- [5.3 伴随矩阵的求法](#5.3 伴随矩阵的求法)
- - [5.3.1 定义法（通用）](#5.3.1 定义法（通用）)
  - [5.3.2 公式法（仅可逆矩阵）](#5.3.2 公式法（仅可逆矩阵）)
六、初等变换与初等矩阵
- [6.1 矩阵的初等变换](#6.1 矩阵的初等变换)
- [6.2 初等矩阵的定义](#6.2 初等矩阵的定义)
- [6.3 初等矩阵的性质与重要公式](#6.3 初等矩阵的性质与重要公式)
- [6.4 行阶梯形矩阵与行最简阶梯型矩阵](#6.4 行阶梯形矩阵与行最简阶梯型矩阵)
- - [6.4.1 行阶梯形矩阵（Row Echelon Form, REF）](#6.4.1 行阶梯形矩阵（Row Echelon Form, REF）)
  - [6.4.2 行最简阶梯型矩阵（Reduced REF, RREF）](#6.4.2 行最简阶梯型矩阵（Reduced REF, RREF）)
七、矩阵方程
- [7.1 常见形式与求解核心](#7.1 常见形式与求解核心)
- [7.2 实例演示](#7.2 实例演示)
八、等价矩阵
- [8.1 定义](#8.1 定义)
- [8.2 等价标准形](#8.2 等价标准形)
- [8.3 等价判定（充要条件）](#8.3 等价判定（充要条件）)
- [8.4 性质](#8.4 性质)
九、矩阵的秩
- [9.1 定义](#9.1 定义)
- [9.2 核心性质](#9.2 核心性质)
- [9.3 求法](#9.3 求法)
- [9.4 秩的关系证明](#9.4 秩的关系证明)

一、矩阵的本质

矩阵是线性变换的具象化表达 ，也是多维度数据的结构化存储载体，其核心价值在于刻画系统信息与变换规律，而非单纯的数字排列。

1.1 线性变换视角

平面或空间中的旋转、缩放、投影等线性变换，均可通过对应矩阵精准描述。

例如，平面内点绕原点逆时针旋转 θ \theta θ 角的线性变换，对应矩阵为 ( cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ) \begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix} (cosθsinθ−sinθcosθ)。

若点坐标为 ( x , y ) (x,y) (x,y)，变换后新坐标 ( x ′ , y ′ ) (x',y') (x′,y′) 满足 ( x ′ y ′ ) = ( cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ) ( x y ) \begin{pmatrix}x'\\y'\end{pmatrix}=\begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix} (x′y′)=(cosθsinθ−sinθcosθ)(xy)。

1.2 数据组织视角

在数据分析、图像处理等领域，矩阵是多维度数据的天然存储结构。例如：

灰度图像的每个像素灰度值可构成矩阵，矩阵行数对应图像高度，列数对应宽度，元素值表征对应位置像素的灰度强度；
多维数据集（如电商用户-商品消费矩阵）中，行代表用户、列代表商品，元素值为消费金额，可直观反映用户消费偏好。

矩阵是系统信息的载体，数乘矩阵需将每个元素乘以常数 k k k，以保证系统特性不变，因此 n n n 阶矩阵 A A A 满足 ∣ k A ∣ = k n ∣ A ∣ |kA|=k^n|A| ∣kA∣=kn∣A∣。

1.3 矩阵的核心特征与变换本质

矩阵类型/运算	本质变换	核心说明
正交矩阵（ A A T = A T A = E AA^T=A^TA=E AAT=ATA=E）	旋转变换	仅改变数据方向，不改变数据间相对距离与夹角（如空间向量旋转、坐标系正交变换）
上/下三角矩阵	剪切变形	沿主对角线方向对数据做剪切调整，主对角线元素保持不变
矩阵 A ± B A\pm B A±B	平移变换	对数据进行整体位置偏移，仅改变数据绝对位置，不改变数据分布特征
数乘矩阵 k A kA kA	缩放变换	所有元素等比例缩放，保持系统结构与数据相对关系不变

1.4 核心关联：秩与行列式

矩阵的秩：行/列向量间的线性无关性程度，是矩阵信息表达能力的核心指标（秩越高，矩阵承载的有效信息越多）；
行列式：仅适用于方阵，刻画线性变换的"伸缩系数"（面积/体积缩放比例），是运算规则（两竖线为运算符号），矩阵本身仅承载系统信息，不直接对应运算。

二、矩阵的定义与基本运算

2.1 矩阵的定义

由 m × n m\times n m×n 个实数（或复数） a i j a_{ij} aij（ i = 1 , 2 , ⋯ , m i = 1,2,\cdots,m i=1,2,⋯,m； j = 1 , 2 , ⋯ , n j = 1,2,\cdots,n j=1,2,⋯,n）按行列顺序排列的矩形数表，称为 m m m 行 n n n 列矩阵，简称 m × n m\times n m×n 矩阵，记为：

A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}\end{pmatrix} A= a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn

可简记为 A = ( a i j ) m × n A = (a_{ij}){m\times n} A=(aij)m×n 或 A m × n A{m\times n} Am×n。

分类	定义	核心特征
方阵	m = n m=n m=n 的矩阵称为 n n n 阶方阵	可定义行列式、逆矩阵、幂运算，是线性变换中"空间到自身映射"的核心载体
同型矩阵	行数、列数分别相等的两个矩阵	可进行加减运算，保证元素一一对应
零矩阵 O O O	所有元素为0的矩阵	矩阵加法的单位元（ A + O = A A+O=A A+O=A），代表"无变换/无数据"状态
单位矩阵 E E E （或 I I I ）	主对角线为1，其余为0的方阵	矩阵乘法的单位元（ E A = A E = A EA=AE=A EA=AE=A），代表"恒等变换"（数据/向量不发生任何改变）

格式规范：矩阵符号无绝对统一标准，数学领域常用圆括号/方括号，编程领域按语言语法（如Python用方括号），同一语境需保持形式统一。

2.2 矩阵的基本运算

2.2.1 相等

定义：两个矩阵 A A A、 B B B 为同型矩阵，且所有对应元素完全相等，则称 A A A 与 B B B 相等（记为 A = B A=B A=B）。

核心：同型是前提，元素全同是关键（缺一不可）。

2.2.2 矩阵加法

定义：同型矩阵对应元素相加。设 A = ( a i j ) m × n A=(a_{ij}){m\times n} A=(aij)m×n， B = ( b i j ) m × n B=(b{ij}){m\times n} B=(bij)m×n，则： A + B = ( a i j + b i j ) m × n A + B=(a{ij}+b_{ij})_{m\times n} A+B=(aij+bij)m×n

性质：

交换律： A + B = B + A A + B = B + A A+B=B+A
结合律： ( A + B ) + C = A + ( B + C ) (A + B)+C = A+(B + C) (A+B)+C=A+(B+C)
负矩阵： A + ( − A ) = O A+(-A)=O A+(−A)=O（负矩阵 − A -A −A 定义为 ( − a i j ) m × n (-a_{ij})_{m\times n} (−aij)m×n）

2.2.3 数与矩阵的乘法（数乘）

定义：设 k k k 为任意实数（或复数）， A = ( a i j ) m × n A=(a_{ij}){m\times n} A=(aij)m×n ，则： k A = ( k a i j ) m × n kA=(ka{ij})_{m\times n} kA=(kaij)m×n

性质：

分配律： k ( A + B ) = k A + k B k(A + B)=kA + kB k(A+B)=kA+kB ； ( k + l ) A = k A + l A (k + l)A=kA + lA (k+l)A=kA+lA
结合律： k ( l A ) = ( k l ) A k(lA)=(kl)A k(lA)=(kl)A
单位数性质： 1 ⋅ A = A 1\cdot A = A 1⋅A=A ； 0 ⋅ A = O 0\cdot A = O 0⋅A=O

加法与数乘统称为矩阵的线性运算 ，满足交换律、结合律、分配律，运算规则与中学代数一致（ A , B , C A,B,C A,B,C 为同型矩阵， k , l k,l k,l 为任意常数）。

2.2.4 矩阵乘法

定义：设 A = ( a i j ) m × s A=(a_{ij}){m\times s} A=(aij)m×s ， B = ( b i j ) s × n B=(b{ij}){s\times n} B=(bij)s×n ，则 A A A 与 B B B 的乘积 A B = ( c i j ) m × n AB=(c{ij}){m\times n} AB=(cij)m×n ，其中： c i j = ∑ k = 1 s a i k b k j c{ij}=\sum_{k = 1}^{s}a_{ik}b_{kj} cij=∑k=1saikbkj

（即 A A A 的第 i i i 行与 B B B 的第 j j j 列对应元素相乘后求和，本质是行向量与列向量的内积）。

前提：左矩阵的列数 = 右矩阵的行数（否则乘法无意义）。

性质：

结合律： ( A B ) C = A ( B C ) (AB)C = A(BC) (AB)C=A(BC)
分配律： A ( B + C ) = A B + A C A(B + C)=AB + AC A(B+C)=AB+AC ； ( B + C ) A = B A + C A (B + C)A=BA + CA (B+C)A=BA+CA
数乘结合律： k ( A B ) = ( k A ) B = A ( k B ) k(AB)=(kA)B = A(kB) k(AB)=(kA)B=A(kB)

重要注意事项：

不满足交换律：一般情况下 A B ≠ B A AB\neq BA AB=BA （如 A 2 × 3 A_{2\times3} A2×3 、 B 3 × 2 B_{3\times2} B3×2 ， A B AB AB 是 2 阶方阵， B A BA BA 是 3 阶方阵）；

不满足消去律：若 A B = A C AB = AC AB=AC 且 A ≠ O A\neq O A=O ，不一定有 B = C B = C B=C ；

零乘积特性： A B = O ⇏ A = O AB=O\not\Rightarrow A=O AB=O⇒A=O 或 B = O B=O B=O （如 A = ( 1 0 0 0 ) A=\begin{pmatrix}1&0\\0&0\end{pmatrix} A=(1000) ， B = ( 0 0 0 1 ) B=\begin{pmatrix}0&0\\0&1\end{pmatrix} B=(0001) ， A B = O AB=O AB=O 但 A , B ≠ O A,B\neq O A,B=O ）。

2.2.5 转置运算

定义：将 m × n m\times n m×n 矩阵 A A A 的行与列互换，得到的 n × m n\times m n×m 矩阵称为 A A A 的转置矩阵，记为 A T A^T AT 。若 A = ( a i j ) m × n A=(a_{ij}){m\times n} A=(aij)m×n ，则 A T = ( a j i ) n × m A^T=(a{ji})_{n\times m} AT=(aji)n×m 。

性质：

自反性： ( A T ) T = A (A^T)^T = A (AT)T=A
数乘兼容性： ( k A ) T = k A T (kA)^T = kA^T (kA)T=kAT
加减兼容性： ( A ± B ) T = A T ± B T (A \pm B)^T = A^T \pm B^T (A±B)T=AT±BT
乘积反序： ( A B ) T = B T A T (AB)^T = B^T A^T (AB)T=BTAT （推广： ( A 1 A 2 ⋯ A k ) T = A k T ⋯ A 2 T A 1 T (A_1A_2\cdots A_k)^T=A_k^T\cdots A_2^T A_1^T (A1A2⋯Ak)T=AkT⋯A2TA1T ）

2.2.6 方阵的幂运算

定义： n n n 阶方阵 A A A 的 m m m 次幂（ m m m 为正整数）：

A m = A ⋅ A ⋅ ⋯ ⋅ A ⏞ m 个 A A^m = \overbrace{A \cdot A \cdot \cdots \cdot A}^{m \text{个} A} Am=A⋅A⋅⋯⋅A m个A

规定： A 0 = E A^0=E A0=E （单位矩阵）。

常用求法：

试算归纳：计算 A 2 , A 3 A^2,A^3 A2,A3 ，归纳幂运算规律（如对角矩阵的幂为对角元素分别取幂）；
满秩分解法：若 r ( A ) = 1 r(A)=1 r(A)=1 ，可分解为 A = α β T A=\alpha\beta^T A=αβT （ α , β \alpha,\beta α,β 为列向量），则：

A m = ( ∑ i = 1 n a i i ) m − 1 α β T = [ tr ( A ) ] m − 1 A A^m=(\sum\limits_{i=1}^n{a_{ii}})^{m-1}\alpha\beta^T=[\text{tr}(A)]^{m-1}A Am=(i=1∑naii)m−1αβT=[tr(A)]m−1A

（ tr ( A ) \text{tr}(A) tr(A) 为矩阵迹 trace，即主对角线元素和）；
牛顿二项展开法：若 A = X + Y A=X+Y A=X+Y 且 X Y = Y X XY=YX XY=YX （如 X = k E X=kE X=kE ），则：

( X + Y ) m = ∑ k = 0 m C m k X m − k Y k (X+Y)^m=\sum_{k=0}^m C_m^k X^{m-k}Y^k (X+Y)m=∑k=0mCmkXm−kYk

核心提醒：

因矩阵乘法不满足交换律，故 ( A + B ) ( A − B ) ≠ A 2 − B 2 (A+B)(A-B)\neq A^2-B^2 (A+B)(A−B)=A2−B2 ， ( A B ) m ≠ A m B m (AB)^m\neq A^mB^m (AB)m=AmBm ；

矩阵多项式：若 f ( x ) = a 0 + a 1 x + ⋯ + a m x m f(x)=a_0+a_1x+\cdots+a_mx^m f(x)=a0+a1x+⋯+amxm ，则 f ( A ) = a 0 E + a 1 A + ⋯ + a m A m f(A)=a_0E+a_1A+\cdots+a_mA^m f(A)=a0E+a1A+⋯+amAm （必须保留单位矩阵 E E E ，保证运算维度一致）。

2.2.7 方阵的行列式

定义： n n n 阶方阵 A A A 的行列式记为 ∣ A ∣ |A| ∣A∣ （或 det ⁡ A \det A detA ），是刻画方阵对应线性变换"伸缩系数"的标量值。

核心性质：

转置不变： ∣ A ∣ = ∣ A T ∣ |A|=|A^T| ∣A∣=∣AT∣ ；
数乘缩放： ∣ k A ∣ = k n ∣ A ∣ |kA|=k^n|A| ∣kA∣=kn∣A∣ （区别于"数乘行列式仅乘某一行/列"）；
和不分配： ∣ A + B ∣ ≠ ∣ A ∣ + ∣ B ∣ |A+B|\neq|A|+|B| ∣A+B∣=∣A∣+∣B∣ （如 A = E A=E A=E ， B = − E B=-E B=−E ， ∣ A + B ∣ = 0 |A+B|=0 ∣A+B∣=0 ， ∣ A ∣ + ∣ B ∣ = 2 |A|+|B|=2 ∣A∣+∣B∣=2 ）；
乘积分配： ∣ A B ∣ = ∣ A ∣ ∣ B ∣ |AB|=|A||B| ∣AB∣=∣A∣∣B∣ （同阶方阵，可推广至有限个同阶方阵乘积）；
非单射性： A ≠ O ⇏ ∣ A ∣ ≠ 0 A\neq O\nRightarrow|A|\neq0 A=O⇏∣A∣=0 ， A ≠ B ⇏ ∣ A ∣ ≠ ∣ B ∣ A\neq B\nRightarrow|A|\neq|B| A=B⇏∣A∣=∣B∣ 。

三、特殊矩阵类型

矩阵类型	定义	核心性质
数量矩阵	k E kE kE （数 k k k 与单位矩阵的乘积）	与任意同阶矩阵可交换（ k E A = A k E kEA=AkE kEA=AkE ），是"等比例缩放变换"的对应矩阵
对角矩阵	非主对角线元素均为0	记为 Λ = diag ( λ 1 , λ 2 , ⋯ , λ n ) \Lambda=\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n) Λ=diag(λ1,λ2,⋯,λn) ；乘法可简化为对角元素对应相乘；幂运算为对角元素分别取幂
上（下）三角矩阵	当 i > j i>j i>j （ i < j i<j i<j ）时， a i j = 0 a_{ij}=0 aij=0 的矩阵	乘积仍为同类型三角矩阵；行列式为主对角线元素乘积；逆矩阵仍为同类型三角矩阵
对称矩阵	A T = A A^T=A AT=A （ a i j = a j i a_{ij}=a_{ji} aij=aji ）	对任意矩阵 A A A ， A T A A^TA ATA 、 A A T AA^T AAT 均为对称矩阵；特征值均为实数
反对称矩阵	A T = − A A^T=-A AT=−A	主对角线元素为0（ a i i = − a i i ⇒ a i i = 0 a_{ii}=-a_{ii}\Rightarrow a_{ii}=0 aii=−aii⇒aii=0 ）；奇数阶反对称矩阵的行列式为0
行/列矩阵	仅含一行/一列的矩阵	又称行/列向量；线性代数中向量默认为列向量；行矩阵转置为列矩阵
分块矩阵	用横线和纵线划分子块的矩阵	子块可视为元素参与运算；分块对角矩阵幂运算： ( A O O B ) n = ( A n O O B n ) \begin{pmatrix}A&O\\O&B\end{pmatrix}^n=\begin{pmatrix}A^n&O\\O&B^n\end{pmatrix} (AOOB)n=(AnOOBn)

实用结论 ：判断矩阵是否为对称矩阵，只需验证 A T = A A^T=A AT=A 。例如 ( A A T ) T = ( A T ) T A T = A A T (AA^T)^T=(A^T)^TA^T=AA^T (AAT)T=(AT)TAT=AAT ，故 A A T AA^T AAT 必为对称矩阵。
分块矩阵乘法规则 ：若 [ A B C D ] \begin{bmatrix}A & B \\C & D\end{bmatrix} [ACBD] 与 [ X Y Z W ] \begin{bmatrix}X & Y \\Z & W\end{bmatrix} [XZYW] 分块兼容（左矩阵列分块与右矩阵行分块一致），则：
$A B C D \] \[ X Y Z W \] = \[ A X + B Z A Y + B W C X + D Z C Y + D W \] \\begin{bmatrix}A \& B \\\\C \& D\\end{bmatrix}\\begin{bmatrix}X \& Y \\\\Z \& W\\end{bmatrix}=\\begin{bmatrix}AX+BZ \& AY+BW \\\\CX+DZ \& CY+DW\\end{bmatrix} \[ACBD\]\[XZYW\]=\[AX+BZCX+DZAY+BWCY+DW$
核心：左矩阵子块仍在左侧，右矩阵子块仍在右侧，子块乘法需满足"左列数=右行数"。

四、逆矩阵

4.1 定义

设 A A A 为 n n n 阶方阵，若存在 n n n 阶方阵 B B B ，使得：

A B = B A = E AB = BA = E AB=BA=E

则称 A A A 可逆（或非奇异）， B B B 为 A A A 的逆矩阵（逆矩阵唯一，记作 A − 1 A^{-1} A−1 ）；若不存在此类 B B B ，则称 A A A 不可逆（或奇异）。

A A A 与 A − 1 A^{-1} A−1 互为逆矩阵。

4.2 可逆判定（充要条件）

以下任一条件成立，均能判断矩阵是否可逆。

∣ A ∣ ≠ 0 |A| \neq 0 ∣A∣=0 （行列式非零）；
r ( A ) = n r(A)=n r(A)=n （满秩矩阵）；
A A A 可表示为有限个初等矩阵的乘积；
A x = 0 Ax=0 Ax=0 仅有零解（齐次线性方程组只有零解）。

实用推论：若 n n n 阶矩阵 A , B , C A,B,C A,B,C 满足 A B C = E ABC=E ABC=E ，则 ∣ A ∣ ⋅ ∣ B ∣ ⋅ ∣ C ∣ = 1 |A|\cdot|B|\cdot|C|=1 ∣A∣⋅∣B∣⋅∣C∣=1 ，故 A , B , C A,B,C A,B,C 均可逆，且 A − 1 = B C A^{-1}=BC A−1=BC ， C − 1 = A B C^{-1}=AB C−1=AB ， B − 1 = C A B^{-1}=C A B−1=CA 。

4.3 核心性质

设 A , B A,B A,B 为同阶可逆方阵，则：

自反性： A − 1 A^{-1} A−1 可逆，且 ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A−1)−1=A ；
数乘可逆：若 k ≠ 0 k\neq0 k=0 ，则 k A kA kA 可逆，且 ( k A ) − 1 = 1 k A − 1 (kA)^{-1}=\frac{1}{k}A^{-1} (kA)−1=k1A−1 （推导： ( k A ) ( 1 k A − 1 ) = k ⋅ 1 k ⋅ A A − 1 = E (kA)(\frac{1}{k}A^{-1})=k\cdot\frac{1}{k}\cdot AA^{-1}=E (kA)(k1A−1)=k⋅k1⋅AA−1=E ）；
乘积反序： A B AB AB 可逆，且 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)−1=B−1A−1 （推广： ( A 1 A 2 ⋯ A k ) − 1 = A k − 1 ⋯ A 2 − 1 A 1 − 1 (A_1A_2\cdots A_k)^{-1}=A_k^{-1}\cdots A_2^{-1}A_1^{-1} (A1A2⋯Ak)−1=Ak−1⋯A2−1A1−1 ）；
转置可逆： A T A^T AT 可逆，且 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T （推导： ( A − 1 A ) T = E T = E ⇒ A T ( A − 1 ) T = E (A^{-1}A)^T=E^T=E\Rightarrow A^T(A^{-1})^T=E (A−1A)T=ET=E⇒AT(A−1)T=E ）；
行列式倒数： ∣ A − 1 ∣ = ∣ A ∣ − 1 = 1 ∣ A ∣ |A^{-1}|=|A|^{-1}=\frac{1}{|A|} ∣A−1∣=∣A∣−1=∣A∣1 （推导： ∣ A − 1 A ∣ = ∣ E ∣ = 1 ⇒ ∣ A − 1 ∣ ⋅ ∣ A ∣ = 1 |A^{-1}A|=|E|=1\Rightarrow |A^{-1}|\cdot|A|=1 ∣A−1A∣=∣E∣=1⇒∣A−1∣⋅∣A∣=1 ）。

重要提醒： A , B A,B A,B 可逆 ⇏ A + B \nRightarrow A+B ⇏A+B 可逆；若追加条件" A − 1 + B − 1 A^{-1}+B^{-1} A−1+B−1 可逆"，则 A + B A+B A+B 可逆，且 ( A + B ) − 1 = B − 1 ( B − 1 + A − 1 ) − 1 A − 1 (A+B)^{-1}=B^{-1}(B^{-1}+A^{-1})^{-1}A^{-1} (A+B)−1=B−1(B−1+A−1)−1A−1

4.4 逆矩阵的求法

4.4.1 定义法

核心原理 ：若存在矩阵 B B B 满足 A B = B A = E AB=BA=E AB=BA=E ，则 B = A − 1 B=A^{-1} B=A−1 。

关键步骤：

设逆矩阵 A − 1 A^{-1} A−1 的元素为未知数（如 2 阶矩阵设为 ( a b c d ) \begin{pmatrix}a&b\\c&d\end{pmatrix} (acbd) ）；
列矩阵乘法等式 A ⋅ A − 1 = E A\cdot A^{-1}=E A⋅A−1=E ，根据"矩阵相等则对应元素相等"列出方程组；
解方程组得未知元素，验证 A − 1 A = E A^{-1}A=E A−1A=E （保证正确性）。

适用场景：低阶矩阵（2 阶）、理论推导（需构造"待求逆矩阵×另一矩阵=E"形式）。

若 B , C B,C B,C 均可逆， A = B C A=BC A=BC，则 A A A 可逆，且 A − 1 = ( B C ) − 1 = C − 1 B − 1 A^{-1}=(BC)^{-1}=C^{-1}B^{-1} A−1=(BC)−1=C−1B−1 .

用定义求逆矩阵，需恒等变形关系式，可提取公因子化和差为乘积，成"待求逆矩阵×另一矩阵=E"的形式；也可先对两端取行列式，非零证可逆后再求逆。

4.4.2 伴随矩阵法

核心原理 ： A − 1 = 1 ∣ A ∣ A ∗ A^{-1}=\frac{1}{|A|}A^* A−1=∣A∣1A∗ （ A ∗ A^* A∗ 为伴随矩阵）。

关键步骤：

计算 ∣ A ∣ |A| ∣A∣ ，判断可逆性（ ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0 则可逆）；
求所有元素的代数余子式： A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij （ M i j M_{ij} Mij 为余子式，即去掉第 i i i 行第 j j j 列后的 n − 1 n-1 n−1 阶行列式）；
构造伴随矩阵： A ∗ A^* A∗ 是代数余子式矩阵的转置；
代入公式得 A − 1 A^{-1} A−1 。

特点：步骤固定，适用于 2-3 阶矩阵；高阶矩阵计算量剧增（需计算 n 2 n^2 n2 个代数余子式）。

4.4.3 初等变换法（核心方法）

核心原理 ：对增广矩阵 ( A ∣ E ) (A|E) (A∣E) 作初等行变换，当左侧 A A A 化为 E E E 时，右侧 E E E 同步化为 A − 1 A^{-1} A−1 ；列变换同理。
( A ∣ E ) → 初等行变换 ( E ∣ A − 1 ) ( A E ) → 初等列变换 ( E A − 1 ) (A|E) \xrightarrow{\text{初等行变换}} (E|A^{-1}) \\ \begin{pmatrix}A\\E\end{pmatrix} \xrightarrow{\text{初等列变换}}\begin{pmatrix}E\\A^{-1}\end{pmatrix} (A∣E)初等行变换 (E∣A−1)(AE)初等列变换 (EA−1)
关键步骤：

构造 n × 2 n n\times2n n×2n 增广矩阵 ( A ∣ E ) (A|E) (A∣E) ；
作初等行变换（行交换、行缩放、行倍加），将左侧 A A A 化为 E E E ；
右侧矩阵即为 A − 1 A^{-1} A−1 。

特点：流程化操作，计算量小、效率高，适用于高阶矩阵（4 阶及以上）和工程实际计算。

4.5 分块矩阵的逆

4.5.1 对角分块矩阵

逆矩阵仍为对角分块，主对角子块分别取逆：
( A O O B ) − 1 = ( A − 1 O O B − 1 ) , ( A 1 O ⋱ O A k ) − 1 = ( A 1 − 1 O ⋱ O A k − 1 ) \begin{gather*} \begin{pmatrix} A & O \\ O & B \end{pmatrix}^{-1} = \begin{pmatrix} A^{-1} & O \\ O & B^{-1} \end{pmatrix}, \quad \begin{pmatrix} A_1 & & O \\ & \ddots & \\ O & & A_k \end{pmatrix}^{-1}= \begin{pmatrix} A_1^{-1} & & O \\ & \ddots & \\ O & & A_k^{-1} \end{pmatrix} \end{gather*} (AOOB)−1=(A−1OOB−1), A1O⋱OAk −1= A1−1O⋱OAk−1

4.5.2 反对角分块矩阵

逆矩阵仍为反对角分块，子块取逆后交换位置：
( O A B O ) − 1 = ( O B − 1 A − 1 O ) , ( O A 1 ⋱ A k O ) − 1 = ( O A k − 1 ⋱ A 1 − 1 O ) \begin{gather*} \begin{pmatrix} O & A \\ B & O \end{pmatrix}^{-1} = \begin{pmatrix} O & B^{-1} \\ A^{-1} & O \end{pmatrix}, \quad \begin{pmatrix} O & & A_1 \\ & \ddots & \\ A_k & & O \end{pmatrix}^{-1}= \begin{pmatrix} O & & A_k^{-1} \\ & \ddots & \\ A_1^{-1} & & O \end{pmatrix} \end{gather*} (OBAO)−1=(OA−1B−1O), OAk⋱A1O −1= OA1−1⋱Ak−1O

4.5.3 三角分块矩阵

逆矩阵仍为同类型三角分块，零子块位置不变，非零非主对角块按以下公式计算：
( A B O D ) − 1 = ( A − 1 − A − 1 B D − 1 O D − 1 ) , ( A O C D ) − 1 = ( A − 1 O − D − 1 C A − 1 D − 1 ) ( O B C D ) − 1 = ( − C − 1 D B − 1 C − 1 B − 1 O ) , ( A B C O ) − 1 = ( O C − 1 B − 1 − B − 1 A C − 1 ) \begin{gather*} \begin{pmatrix} A & B \\ O & D \end{pmatrix}^{-1}= \begin{pmatrix} A^{-1} & -A^{-1}BD^{-1} \\ O & D^{-1} \end{pmatrix}, \quad \begin{pmatrix} A & O \\ C & D \end{pmatrix}^{-1}= \begin{pmatrix} A^{-1} & O \\ -D^{-1}CA^{-1} & D^{-1} \end{pmatrix} \\ \begin{pmatrix} O & B \\ C & D \end{pmatrix}^{-1}= \begin{pmatrix} -C^{-1}DB^{-1} & C^{-1} \\ B^{-1} & O \end{pmatrix}, \quad \begin{pmatrix} A & B \\ C & O \end{pmatrix}^{-1}= \begin{pmatrix} O & C^{-1} \\ B^{-1} & -B^{-1}AC^{-1} \end{pmatrix} \end{gather*} (AOBD)−1=(A−1O−A−1BD−1D−1),(ACOD)−1=(A−1−D−1CA−1OD−1)(OCBD)−1=(−C−1DB−1B−1C−1O),(ACBO)−1=(OB−1C−1−B−1AC−1)

记忆技巧：非主对角块 = -（主对角块逆 × 原非主对角块 × 另一主对角块逆）。即 "左乘同行，右乘同列，再添负号" 。

五、伴随矩阵

5.1 定义

n n n 阶方阵 A A A 的伴随矩阵 A ∗ A^* A∗ 是代数余子式矩阵的转置：
A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) A^* = \begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \end{pmatrix} A∗= A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann

其中 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij （ M i j M_{ij} Mij 为 a i j a_{ij} aij 的余子式）。

5.2 核心性质

基础恒等式： A A ∗ = A ∗ A = ∣ A ∣ E AA^*=A^*A=|A|E AA∗=A∗A=∣A∣E，故 A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1；
行列式： ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*|=|A|^{n-1} ∣A∗∣=∣A∣n−1（ n ≥ 2 n\geq2 n≥2）；
证：由 A A ∗ = ∣ A ∣ E n AA^*=|A|E_n AA∗=∣A∣En，两边取行列式得 ∣ A A ∗ ∣ = ∣ A ∣ ∣ A ∗ ∣ = ∣ ∣ A ∣ E n ∣ = ∣ A ∣ n |AA^*|=|A||A^*|=||A|E_n|=|A|^n ∣AA∗∣=∣A∣∣A∗∣=∣∣A∣En∣=∣A∣n。
- 若 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0，则 ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*|=|A|^{n-1} ∣A∗∣=∣A∣n−1；
- 若 ∣ A ∣ = 0 |A|=0 ∣A∣=0，
  
  当 A = O A=O A=O 时， A ∗ = O A^*=O A∗=O，显然 ∣ A ∗ ∣ = 0 = ∣ A ∣ n − 1 |A^*|=0=|A|^{n-1} ∣A∗∣=0=∣A∣n−1；
  
  当 A ≠ O A\neq O A=O 时，若 ∣ A ∗ ∣ ≠ 0 |A^*|\neq0 ∣A∗∣=0，则 A ∗ A^* A∗ 可逆，由 A A ∗ = O AA^*=O AA∗=O 两边右侧乘 ( A ∗ ) − 1 (A^*)^{-1} (A∗)−1得 A = O A=O A=O，矛盾，故 ∣ A ∗ ∣ = 0 = ∣ A ∣ n − 1 |A^*|=0=|A|^{n-1} ∣A∗∣=0=∣A∣n−1。
综上， ∣ A ∗ ∣ = ∣ A ∣ n − 1 \vert A^*\vert=\vert A\vert^{n - 1} ∣A∗∣=∣A∣n−1。
数乘伴随： ( k A ) ∗ = k n − 1 A ∗ (kA)^*=k^{n-1}A^* (kA)∗=kn−1A∗（ n ≥ 2 n\geq2 n≥2）；
转置/逆伴随： ( A T ) ∗ = ( A ∗ ) T (A^T)^*=(A^*)^T (AT)∗=(A∗)T， ( A − 1 ) ∗ = ( A ∗ ) − 1 = 1 ∣ A ∣ A (A^{-1})^*=(A^*)^{-1}=\frac{1}{|A|}A (A−1)∗=(A∗)−1=∣A∣1A；
乘积伴随： ( A B ) ∗ = B ∗ A ∗ (AB)^*=B^*A^* (AB)∗=B∗A∗（同阶方阵）；
伴随的伴随： ( A ∗ ) ∗ = ∣ A ∣ n − 2 A (A^*)^*=|A|^{n-2}A (A∗)∗=∣A∣n−2A（ n ≥ 2 n\geq2 n≥2）。

其实，当 A , B A,B A,B 不可逆时， ∣ A ∗ ∣ = ∣ A ∣ n − 1 , ( A B ) ∗ = B ∗ A ∗ |A^*|=|A|^{n-1},(AB)^*=B^*A^* ∣A∗∣=∣A∣n−1,(AB)∗=B∗A∗ 仍然成立。

易混易错点：

( A + B ) ∗ ≠ A ∗ + B ∗ (A+B)^*\neq A^*+B^* (A+B)∗=A∗+B∗ ， ( A + B ) − 1 ≠ A − 1 + B − 1 (A+B)^{-1}\neq A^{-1}+B^{-1} (A+B)−1=A−1+B−1 ；

∣ A + B ∣ ≠ ∣ A ∣ + ∣ B ∣ |A+B|\neq|A|+|B| ∣A+B∣=∣A∣+∣B∣ ，仅转置满足 ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT 。

5.3 伴随矩阵的求法

5.3.1 定义法（通用）

核心逻辑：先算代数余子式，再转置。

具体步骤：

求余子式 M i j M_{ij} Mij ：去掉第 i i i 行第 j j j 列，计算剩余元素的 n − 1 n-1 n−1 阶行列式；
求代数余子式 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij ；
构造代数余子式矩阵，转置得 A ∗ A^* A∗ 。

5.3.2 公式法（仅可逆矩阵）

核心逻辑 ：利用 A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1，前提是矩阵行列式 ∣ A ∣ ≠ 0 |A| \neq 0 ∣A∣=0（即矩阵可逆）。

具体步骤：

验证可逆：计算 ∣ A ∣ |A| ∣A∣，确认 ∣ A ∣ ≠ 0 |A| \neq 0 ∣A∣=0（若为 0，此方法失效）。
求逆矩阵 A − 1 A^{-1} A−1：用初等变换法等求出 A − 1 A^{-1} A−1。
数乘得 A ∗ A^* A∗：将 ∣ A ∣ |A| ∣A∣与 A − 1 A^{-1} A−1作数乘（矩阵每个元素乘 ∣ A ∣ |A| ∣A∣），结果即为 A ∗ A^* A∗。

六、初等变换与初等矩阵

高等数学中，初等函数由基本初等函数（常函数、三角函数、幂函数、对数函数、指数函数、反三角函数）经有限次四则运算或函数复合构成。类似的，代数学里的初等变换以三种基本初等变换为基础。

6.1 矩阵的初等变换

分为行变换 （记 r r r ）和列变换 （记 c c c ），共三类：

变换类型	行变换记法	列变换记法
互换	r i ↔ r j r_i\leftrightarrow r_j ri↔rj	c i ↔ c j c_i\leftrightarrow c_j ci↔cj
数乘（ k ≠ 0 k\neq0 k=0）	k r i kr_i kri	k c i kc_i kci
倍加	r i + k r j r_i+kr_j ri+krj	c i + k c j c_i+kc_j ci+kcj

变换使用规则：

求矩阵的秩：行、列变换可混用（不改变秩）；

求逆矩阵：仅用行变换或仅用列变换（不可混用）；

解线性方程组：只能用行变换（保证方程组同解）。

6.2 初等矩阵的定义

由单位矩阵经一次初等变换得到的矩阵，称为初等矩阵（三种初等变换对应三种初等矩阵）。以 3 阶矩阵为例：

互换型： E i j E_{ij} Eij （交换第 i , j i,j i,j 行/列），如 E 12 = ( 0 1 0 1 0 0 0 0 1 ) E_{12}=\begin{pmatrix}0&1&0\\1&0&0\\0&0&1\end{pmatrix} E12= 010100001 ；
数乘型： E i ( k ) E_i(k) Ei(k) （第 i i i 行/列乘非零常数 k k k ），如 E 2 ( 3 ) = ( 1 0 0 0 3 0 0 0 1 ) E_2(3)=\begin{pmatrix}1&0&0\\0&3&0\\0&0&1\end{pmatrix} E2(3)= 100030001 ；
倍加型： E i j ( k ) E_{ij}(k) Eij(k) （"第 j j j 行的 k k k 倍加到第 i i i 行"或"第 i 列的 k 倍加到第 j 列"），如 E 12 ( 2 ) = ( 1 2 0 0 1 0 0 0 1 ) E_{12}(2)=\begin{pmatrix}1&2&0\\0&1&0\\0&0&1\end{pmatrix} E12(2)= 100210001

核心规律（左行右列）：

对矩阵 A A A 作初等行变换 ⇔ \Leftrightarrow ⇔ 在 A A A 左侧乘对应初等矩阵；
对矩阵 A A A 作初等列变换 ⇔ \Leftrightarrow ⇔ 在 A A A 右侧乘对应初等矩阵。

示例： E 12 A E_{12}A E12A 等价于交换 A A A 的第 1、2 行； A E 12 AE_{12} AE12 等价于交换 A A A 的第 1、2 列。

设 A = [ a i j ] A=[a_{ij}] A=[aij] 是 n 阶矩阵， Λ = diag ( λ 1 , λ 2 , ... , λ n ) \Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n) Λ=diag(λ1,λ2,...,λn) ，则 A Λ = [ λ j a i j ] , Λ A = [ λ i a i j ] A\Lambda=[\lambda_ja_{ij}],\Lambda A=[\lambda_ia_{ij}] AΛ=[λjaij],ΛA=[λiaij] .

6.3 初等矩阵的性质与重要公式

转置特性：
- E i j T = E i j E_{ij}^T=E_{ij} EijT=Eij ， E i T ( k ) = E i ( k ) E_i^T(k)=E_i(k) EiT(k)=Ei(k) ；
- E i j T ( k ) = E j i ( k ) E_{ij}^T(k)=E_{ji}(k) EijT(k)=Eji(k) （倍加型转置后下标交换）。
可逆性：

三种初等矩阵行列式均非零（ ∣ E i ( k ) ∣ = k ≠ 0 |E_i(k)|=k\neq0 ∣Ei(k)∣=k=0、 ∣ E i j ∣ = − 1 |E_{ij}|=-1 ∣Eij∣=−1、 ∣ E i j ( k ) ∣ = 1 |E_{ij}(k)|=1 ∣Eij(k)∣=1），故均可逆，且逆矩阵仍为同类初等矩阵。由于初等矩阵与初等变换一一对应，其逆矩阵本质是 "抵消原变换效果" 的逆变换所对应的初等矩阵，具体如下：
- E i j − 1 = E i j E_{ij}^{-1}=E_{ij} Eij−1=Eij （交换两次还原）；
- E i ( k ) − 1 = E i ( 1 k ) E_i(k)^{-1}=E_i\left(\frac{1}{k}\right) Ei(k)−1=Ei(k1) （乘 1 k \frac{1}{k} k1 抵消数乘）；
- E i j ( k ) − 1 = E i j ( − k ) E_{ij}(k)^{-1}=E_{ij}(-k) Eij(k)−1=Eij(−k) （加 − k -k −k 倍抵消倍加）。
可逆矩阵与初等矩阵的关系：
- 充要条件：矩阵 A A A 可逆 ⇔ A \Leftrightarrow A ⇔A 可表示为有限个初等矩阵的乘积（ A = P 1 P 2 ⋯ P m A=P_1P_2\cdots P_m A=P1P2⋯Pm ）；
- 几何意义： A α = P 1 P 2 ⋯ P m α A\alpha = P_1P_2\cdots P_m\alpha Aα=P1P2⋯Pmα 表示向量 α \alpha α 经一系列初等变换（旋转、缩放、剪切）得到新向量
- 逆矩阵求解原理：若 A A A 可逆，则存在初等矩阵 Q 1 , ... , Q m Q_1,\dots,Q_m Q1,...,Qm 使得 Q m ⋯ Q 1 A = E Q_m\cdots Q_1A=E Qm⋯Q1A=E ，故 Q m ⋯ Q 1 E = A − 1 Q_m\cdots Q_1E=A^{-1} Qm⋯Q1E=A−1 （即初等行变换求逆的核心逻辑）。列变换同理。
上述关系既揭示了可逆矩阵的结构本质（由初等变换 "搭建" 而成），也提供了可逆性判定与逆矩阵求解的具体方法，是线性代数中连接矩阵变换与运算的关键桥梁。

6.4 行阶梯形矩阵与行最简阶梯型矩阵

6.4.1 行阶梯形矩阵（Row Echelon Form, REF）

经初等行变换得到，是求秩、解方程组的基础，需满足 2 个条件：

条件 1：全零行（元素全为 0 的行）全部集中在矩阵下方；
条件 2：非零行的首个非零元素（主元），列标从上行到下行严格递增（下一行主元更靠右）；

补充说明：REF 的主元可不为 1，主元所在列也可包含非零元素，且同一矩阵的 REF 不唯一。

示例： ( 1 2 3 0 2 2 0 0 0 ) \begin{pmatrix} 1 & 2 & 3 \\ 0 & 2 & 2 \\ 0 & 0 & 0 \end{pmatrix} 100220320

6.4.2 行最简阶梯型矩阵（Reduced REF, RREF）

REF 的特殊形式，额外满足 2 个 "最简" 条件：

条件 3：非零行主元均为 1（单位主元）；
条件 4：主元所在列的其他元素均为0（主元列是 "标准单位列"）。

补充说明：同一矩阵的 RREF 唯一；可逆矩阵的 RREF 必为同阶单位矩阵 E E E（呼应可逆矩阵可经初等行变换化为 E E E 的性质）。

示例： ( 1 0 1 0 1 1 0 0 0 ) \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \end{pmatrix} 100010110

七、矩阵方程

7.1 常见形式与求解核心

矩阵方程是含未知矩阵的等式，核心形式及解法如下（ A , B , C A,B,C A,B,C 已知， X X X 未知）：

方程形式	求解条件	解法
A X = B AX=B AX=B	A A A 可逆	X = A − 1 B X=A^{-1}B X=A−1B （初等行变换： [ A ∣ B ] → 行变换 [ E ∣ A − 1 B ] [A\|B]\xrightarrow{\text{行变换}}[E\|A^{-1}B] [A∣B]行变换 [E∣A−1B] ）
X A = B XA=B XA=B	A A A 可逆	X = B A − 1 X=BA^{-1} X=BA−1 （初等列变换： ( A B ) → 列变换 ( E B A − 1 ) \begin{pmatrix}A\\B\end{pmatrix}\xrightarrow{\text{列变换}}\begin{pmatrix}E\\BA^{-1}\end{pmatrix} (AB)列变换 (EBA−1) ）
A X C = B AXC=B AXC=B	A , C A,C A,C 可逆	X = A − 1 B C − 1 X=A^{-1}BC^{-1} X=A−1BC−1 （先求 A − 1 B A^{-1}B A−1B ，再求 ( A − 1 B ) C − 1 (A^{-1}B)C^{-1} (A−1B)C−1 ）

计算技巧：可通过初等变换直接求结果，无需单独算逆矩阵。例如求 A − 1 B A^{-1}B A−1B，对增广矩阵 [ A ∣ B ] [A|B] [A∣B] 做初等行变换，当 A A A 变为单位矩阵时， B B B 变为 A − 1 B A^{-1}B A−1B；求 B C − 1 BC^{-1} BC−1 可用初等列变换。

7.2 实例演示

已知 A = ( 1 2 3 4 ) A=\begin{pmatrix}1&2\\3&4\end{pmatrix} A=(1324) ， C = ( 1 0 0 2 ) C=\begin{pmatrix}1&0\\0&2\end{pmatrix} C=(1002) ， B = ( 3 1 2 4 ) B=\begin{pmatrix}3&1\\2&4\end{pmatrix} B=(3214) ，求解 A X C = B AXC=B AXC=B ：

方法一：直接求逆法

求 A − 1 A^{-1} A−1 ： A − 1 = ( − 2 1 3 2 − 1 2 ) A^{-1} = \begin{pmatrix} -2 & 1 \\ \frac{3}{2} & -\frac{1}{2} \end{pmatrix} A−1=(−2231−21)；
求 C − 1 C^{-1} C−1 ：对角矩阵逆为 "对角元素取倒数"，得 C − 1 = ( 1 0 0 1 2 ) C^{-1} = \begin{pmatrix} 1 & 0 \\ 0 & \frac{1}{2} \end{pmatrix} C−1=(10021)；
计算 X X X ： X = A − 1 B C − 1 = ( − 2 1 3 2 − 1 2 ) ( 3 1 2 4 ) ( 1 0 0 1 2 ) = ( − 4 1 7 2 − 1 4 ) X = A^{-1}BC^{-1} = \begin{pmatrix} -2 & 1 \\ \frac{3}{2} & -\frac{1}{2} \end{pmatrix}\begin{pmatrix} 3 & 1 \\ 2 & 4 \end{pmatrix}\begin{pmatrix} 1 & 0 \\ 0 & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} -4 & 1 \\ \frac{7}{2} & -\frac{1}{4} \end{pmatrix} X=A−1BC−1=(−2231−21)(3214)(10021)=(−4271−41)。

方法二：初等变换法（推荐）

初等行变换求 A − 1 B A^{-1}B A−1B ：

构造 [ A ∣ B ] = ( 1 2 3 1 3 4 2 4 ) [A|B]=\left(\begin{array}{cc|cc}1&2&3&1\\3&4&2&4\end{array}\right) [A∣B]=(13243214) ，经 r 2 − 3 r 1 r_2-3r_1 r2−3r1 、 r 2 × ( − 1 2 ) r_2\times(-\frac{1}{2}) r2×(−21) 、 r 1 − 2 r 2 r_1-2r_2 r1−2r2 得 ( 1 0 − 4 2 0 1 7 2 − 1 2 ) \left(\begin{array}{cc|cc}1&0&-4&2\\0&1&\frac{7}{2}&-\frac{1}{2}\end{array}\right) (1001−4272−21)

即 A − 1 B = ( − 4 2 7 2 − 1 2 ) A^{-1}B=\begin{pmatrix}-4&2\\\frac{7}{2}&-\frac{1}{2}\end{pmatrix} A−1B=(−4272−21) ；
列变换求 ( A − 1 B ) C − 1 (A^{-1}B)C^{-1} (A−1B)C−1：

构造 ( C A − 1 B ) = ( 1 0 0 2 − 4 2 7 2 − 1 2 ) \begin{pmatrix} C \\ A^{-1}B \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 2 \\ -4 & 2 \\ \frac{7}{2} & -\frac{1}{2} \end{pmatrix} (CA−1B)= 10−427022−21 ，经 c 2 × 1 2 c_2\times\frac{1}{2} c2×21，得 ( 1 0 0 1 − 4 1 7 2 − 1 4 ) \begin{pmatrix} 1 & 0 \\ 0 & 1 \\ -4 & 1 \\ \frac{7}{2} & -\frac{1}{4} \end{pmatrix} 10−427011−41

即 X = ( − 4 1 7 2 − 1 4 ) X = \begin{pmatrix} -4 & 1 \\ \frac{7}{2} & -\frac{1}{4} \end{pmatrix} X=(−4271−41)。

八、等价矩阵

8.1 定义

设 A , B A,B A,B 为 m × n m\times n m×n 矩阵，若存在可逆矩阵 P m × m P_{m\times m} Pm×m 、 Q n × n Q_{n\times n} Qn×n ，使得 P A Q = B PAQ=B PAQ=B ，则称 A A A 与 B B B 等价，记为 A ≅ B A\cong B A≅B 。

8.2 等价标准形

任意矩阵可经初等变换化为唯一的等价标准形：

( E r O O O ) \begin{pmatrix}E_r&O\\O&O\end{pmatrix} (ErOOO)

其中 r = r ( A ) r=r(A) r=r(A) （矩阵的秩），即存在可逆矩阵 P , Q P,Q P,Q 使得 P A Q = ( E r O O O ) PAQ=\begin{pmatrix}E_r&O\\O&O\end{pmatrix} PAQ=(ErOOO) 。

8.3 等价判定（充要条件）

m × n m\times n m×n 矩阵 A A A 与 B B B 等价，满足以下任一条件均可判定：

r ( A ) = r ( B ) r(A)=r(B) r(A)=r(B) ；
A A A 经有限次初等变换可化为 B B B ；
A A A 与 B B B 有相同的等价标准形。

8.4 性质

反身性： A ≅ A A\cong A A≅A ；
对称性： A ≅ B ⇒ B ≅ A A\cong B\Rightarrow B\cong A A≅B⇒B≅A ；
传递性： A ≅ B A\cong B A≅B 且 B ≅ C ⇒ A ≅ C B\cong C\Rightarrow A\cong C B≅C⇒A≅C 。

九、矩阵的秩

9.1 定义

子式：在 m × n m\times n m×n 矩阵 A A A 中，任取 k k k 行 k k k 列（ 1 ≤ k ≤ min ⁡ ( m , n ) 1\leq k\leq\min(m,n) 1≤k≤min(m,n) ），交叉处元素构成的 k k k 阶行列式，称为 A A A 的 k k k 阶子式。
矩阵的秩 ： A A A 中所有非零子式的最高阶数，记为 r ( A ) r(A) r(A) 或 r a n k ( A ) rank(A) rank(A)（零矩阵的秩为 0）。

等价表述 ： r ( A ) = k ⇔ A r(A)=k \Leftrightarrow A r(A)=k⇔A 存在 k k k 个线性无关的行/列向量，且任意 k + 1 k+1 k+1 个行/列向量线性相关。

方阵的特殊关系 ： n n n 阶方阵 A A A 满秩（ r ( A ) = n r(A)=n r(A)=n ） ⇔ ∣ A ∣ ≠ 0 ⇔ A \Leftrightarrow |A|\neq0 \Leftrightarrow A ⇔∣A∣=0⇔A 可逆（满秩与可逆等价）；非方阵无"可逆"概念，仅可讨论满秩（ r ( A ) = min ⁡ ( m , n ) r(A)=\min(m,n) r(A)=min(m,n) ）。

示例：求 A = ( 1 2 3 2 4 6 3 5 7 ) A=\begin{pmatrix}1&2&3\\2&4&6\\3&5&7\end{pmatrix} A= 123245367 的秩

1 阶子式：存在非零元素（如 1），故有 1 阶非零子式；
2 阶子式： ∣ 1 2 3 5 ∣ = − 1 ≠ 0 \begin{vmatrix}1&2\\3&5\end{vmatrix}=-1\neq0 1325 =−1=0，故有 2 阶非零子式；
3 阶子式： ∣ A ∣ = 0 |A|=0 ∣A∣=0，无 3 阶非零子式。

结论： r ( A ) = 2 r(A)=2 r(A)=2。

9.2 核心性质

性质	公式/说明
范围约束	0 ≤ r ( A m × n ) ≤ min ⁡ ( m , n ) 0\leq r(A_{m\times n})\leq\min(m,n) 0≤r(Am×n)≤min(m,n)
数乘不变	r ( k A ) = r ( A ) r(kA)=r(A) r(kA)=r(A) （ k ≠ 0 k\neq0 k=0 ）
转置不变	r ( A ) = r ( A T ) = r ( A A T ) = r ( A T A ) r(A)=r(A^T)=r(AA^T)=r(A^TA) r(A)=r(AT)=r(AAT)=r(ATA)。若 r ( A ) = r ( [ A ∣ B ] ) r(A)=r([A\|B]) r(A)=r([A∣B]) ，则 r ( A T ) = r ( ( A T B T ) ) r(A^T)=r(\begin{pmatrix}A^T\\B^T\end{pmatrix}) r(AT)=r((ATBT)) .
等价不变	A ≅ B ⇒ r ( A ) = r ( B ) A\cong B\Rightarrow r(A)=r(B) A≅B⇒r(A)=r(B)
伴随矩阵秩	r ( A ∗ ) = { n , r ( A ) = n 1 , r ( A ) = n − 1 0 , r ( A ) ≤ n − 2 r(A^*)=\begin{cases}n, & r(A)=n\\1, & r(A)=n-1\\0, & r(A)\leq n-2\end{cases} r(A∗)=⎩ ⎨ ⎧n,1,0,r(A)=nr(A)=n−1r(A)≤n−2 （ n ≥ 2 n\geq2 n≥2 ）
可逆乘积不变	P , Q P,Q P,Q 可逆 ⇒ r ( P A Q ) = r ( P A ) = r ( A Q ) = r ( A ) \Rightarrow r(PAQ)=r(PA)=r(AQ)=r(A) ⇒r(PAQ)=r(PA)=r(AQ)=r(A)
和的秩约束	r ( A + B ) ≤ r ( A ) + r ( B ) r(A+B)\leq r(A)+r(B) r(A+B)≤r(A)+r(B)
积的秩约束	r ( A B ) ≤ min ⁡ ( r ( A ) , r ( B ) ) r(AB)\leq\min(r(A),r(B)) r(AB)≤min(r(A),r(B))
零积不等式	A B = O ⇒ r ( A ) + r ( B ) ≤ n AB=O\Rightarrow r(A)+r(B)\leq n AB=O⇒r(A)+r(B)≤n （ A m × n , B n × l A_{m\times n},B_{n\times l} Am×n,Bn×l ， B B B 的列向量是 A x = 0 Ax=0 Ax=0 的解，从而 r ( B ) ≤ n − r ( A ) r(B)\leq n-r(A) r(B)≤n−r(A) ）
西尔维斯特不等式	r ( A B ) ≥ r ( A ) + r ( B ) − n r(AB)\geq r(A)+r(B)-n r(AB)≥r(A)+r(B)−n （ A m × n , B n × l A_{m\times n},B_{n\times l} Am×n,Bn×l ）

伴随矩阵秩的证明：

r ( A ) = n r(A)=n r(A)=n （满秩）： A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1 ，故 r ( A ∗ ) = n r(A^*)=n r(A∗)=n ；

r ( A ) = n − 1 r(A)=n-1 r(A)=n−1 ： A A A 存在非零 n − 1 n-1 n−1 阶子式（ A ∗ ≠ O A^*\neq O A∗=O ， r ( A ∗ ) ≥ 1 r(A^*)\geq1 r(A∗)≥1 ），且 A A ∗ = ∣ A ∣ E = O AA^*=|A|E=O AA∗=∣A∣E=O （ r ( A ) + r ( A ∗ ) ≤ n r(A)+r(A^*)\leq n r(A)+r(A∗)≤n ，故 r ( A ∗ ) ≤ 1 r(A^*)\leq1 r(A∗)≤1 ），因此 r ( A ∗ ) = 1 r(A^*)=1 r(A∗)=1 ；

r ( A ) ≤ n − 2 r(A)\leq n-2 r(A)≤n−2 ： A A A 的所有 n − 1 n-1 n−1 阶子式为 0（ A ∗ = O A^*=O A∗=O ），故 r ( A ∗ ) = 0 r(A^*)=0 r(A∗)=0 。

9.3 求法

方法	步骤	适用场景
定义法	依次计算 1 阶、2 阶...子式，找到最高阶非零子式的阶数	2-3 阶低阶矩阵
初等行变换法	将矩阵化为行阶梯形，非零行的行数即为秩（核心方法）	所有矩阵（尤其是高阶）

示例：求 A = ( 1 2 3 4 2 4 6 8 3 5 7 9 ) A=\begin{pmatrix}1&2&3&4\\2&4&6&8\\3&5&7&9\end{pmatrix} A= 123245367489 的秩

行变换操作： r 2 − 2 r 1 , r 3 − 3 r 1 r_2 - 2r_1,r_3 - 3r_1 r2−2r1,r3−3r1，得： ( 1 2 3 4 0 0 0 0 0 − 1 − 2 − 3 ) \begin{pmatrix}1&2&3&4\\0&0&0&0\\0&-1&-2&-3\end{pmatrix} 10020−130−240−3 ；

交换第二、三行（ r 2 ↔ r 3 r_2\leftrightarrow r_3 r2↔r3），得行阶梯形： ( 1 2 3 4 0 − 1 − 2 − 3 0 0 0 0 ) \begin{pmatrix}1&2&3&4\\0&-1&-2&-3\\0&0&0&0\end{pmatrix} 1002−103−204−30 。

结论：非零行数为 2，故 r ( A ) = 2 r(A)=2 r(A)=2。

9.4 秩的关系证明

证 r ( A ) ≤ r ( B ) r(A) \leq r(B) r(A)≤r(B) ：证明 A A A 的行/列向量组可由 B B B 的行/列向量组线性表示；
证 r ( A ) = r ( B ) r(A) = r(B) r(A)=r(B) ：
- 夹逼法：通过秩的不等式链双向约束（如 a ≤ r ( A ) ≤ r ( B ) ≤ a a\leq r(A)\leq r(B)\leq a a≤r(A)≤r(B)≤a ）；
- 同解法：证明 A x = 0 Ax=0 Ax=0 与 B x = 0 Bx=0 Bx=0 同解（同解方程组的解空间维数相同，维数 = n − r =n - r =n−r ），可直接得 r ( A ) = r ( B ) r(A) = r(B) r(A)=r(B)。