线性代数学习笔记(未完结)

线性代数学习笔记

1 高斯消元法与矩阵的初等变换

1.1 基本量与基本定义

含有 \(n\) 个未知量、\(m\) 个方程的线性方程组 称为 \(m \times n\) 线性方程组(或 \(n\) 元线性方程组),形式:
\[\begin{cases} a_{11}x_1 + a_{12} x_2 + \cdots + a_{1n} x_n = b_1\\ a_{21}x_1 + a_{22} x_2 + \cdots + a_{2n} x_n = b_2\\ a_{31}x_1 + a_{32} x_2 + \cdots + a_{3n} x_n = b_3\\ \dots\dots\\ a_{m1}x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n = b_m \end{cases} \]


与线性方程组有关的两种矩阵:将线性方程组的 系数 取出来按次序排列起来的表称为 系数矩阵 ;将线性方程组的 系数常数项 取出来按次序排列起来的表称为 增广矩阵

矩阵的基本量:\(m \times n\) 矩阵中的每一个数称为其 元素 ,位于第 \(i\) 行与第 \(j\) 列交叉处的元素称为矩阵的 \((i,j)\) ,\(m \times n\) 称为矩阵的

特殊矩阵:元素全 \(0\) 的矩阵是 零矩阵 ,记为 \(\boldsymbol O_{m\times n}\),或简记为 \(\boldsymbol O\);\(m = n\) 的矩阵是 方阵 ;\(a_{ii} = 1\) 的方阵称为 单位矩阵 ;两个矩阵行数和列数分别相等则是 同型矩阵 ;所有元素对应相等的同型矩阵是 相等矩阵 ,即 \(\boldsymbol A = \boldsymbol B\)。

矩阵的 行阶梯形

  • 元素全为 \(0\) 的行(称为 零行)均在下方(如果有零行的话);
  • 非零行中从左边数起的第一个非 \(0\) 元素称为该行的 主元,两个相邻非零行中,下一行的主元必位于上一行主元的右边。

行最简形矩阵 :若行阶梯形矩阵的主元为 \(1\),且主元上、下方元素(如果存在)全是 \(0\)。

矩阵的秩 :非零矩阵的行阶梯形中非零行的个数 \(r\),记为 \(\mathrm{rank}(\boldsymbol A) = r\) 或 \(R(\boldsymbol A) = r\))。

注:\(R(A)\) 是行阶梯形矩阵中主元的个数,且满足 \(R(\boldsymbol A) \le \min\{m,n\}\)。

若 \(n\) 阶方阵(矩阵) \(\boldsymbol A\) 满足 \(R(\boldsymbol A) = n\),则 \(A\) 为 满秩矩阵 ,反之则为 降秩矩阵

1.2 初等变换与方程组解的判定

线性方程组的 初等变换 & 矩阵的 初等行变换

  1. 互换两个方程的位置(互换增广矩阵两行的位置,即 \(r_i \longleftrightarrow r_j\));
  2. 用一个非零数乘某个方程(用一个非零数乘增广矩阵的某一行,即 \(k \times r_i\));
  3. 把第 \(j\) 个方程乘以一个(非零)数再加到第 \(i\) 个方程上(把第 \(j\) 行乘以一个非零数加到第 \(i\) 行,即 \(r_i + kr_j\))。

初等变换后,不会改变线性方程组的 。初等行变换后,不会改变矩阵的


线性方程组的解的存在性和唯一性:

设 \(m \times n\) 线性方程组的系数矩阵为 \(\boldsymbol A\),增广矩阵为 \(\boldsymbol B\),则:

  • 方程组无解当且仅当 \(R(\boldsymbol A) \ne R(\boldsymbol B)\)。
  • 方程组有解当且仅当 \(R(\boldsymbol A) = R(\boldsymbol B)\),具体来说:
    • 方程组有唯一解当且仅当 \(R(\boldsymbol A) = R(\boldsymbol B) = n\)。
    • 方程组有无穷多个解当且仅当 \(R(\boldsymbol A) = R(\boldsymbol B) < n\)。

注:\(R(\boldsymbol A)\) 一定小于 \(R(\boldsymbol B)\)。

齐次线性方程组 :常数项均为 \(0\)。则其至少有一个 零解 ,称为 平凡解 ;除零解之外的其它解称为 非零解非平凡解

齐次线性方程组解的存在性和唯一性:有非零解的充要条件是 \(R(\boldsymbol A) < n\),即系数矩阵的秩小于未知量的个数。(方程个数小于未知量个数)

先给出 非齐次线性方程组齐次线性方程组 的解的判定流程图:

非齐次:
flowchart LR B["B(增广矩阵)"] --> OP1["对 B 施行初等行变换<br/>将 B 化为行阶梯形"] OP1 --> D1{"R(A) = R(B)"} D1 -- "否" --> OUT0["原方程组无解"] D1 -- "是" --> D2{"R(A) = R(B) 且 < n"} D2 -- "否" --> OUT1["原方程组有唯一解"] D2 -- "是" --> OUT2["原方程组有无穷多个解"]

齐次:
flowchart LR A["A(系数矩阵)"] --> D0{"m < n"} D0 -- "是" --> OUT2["原方程组有非零解"] D0 -- "否" --> OP1["对 A 施行初等行变换<br/>将 A 化为行阶梯形"] OP1 --> D1{"R(A) < n"} D1 -- "否" --> OUT1["原方程组只有零解"] D1 -- "是" --> OUT2

1.3 标准形

矩阵的 初等列变换

  1. \(ci \longleftrightarrow c_j\);
  2. \(k \times c_i\);
  3. \(c_i + k c_j\)。

矩阵的 初等行变换初等列变换 统称为矩阵的 初等变换 。矩阵 \(\boldsymbol A\) 通过初等变换变为 \(\boldsymbol B\),则称二者 等价 ,记为 \(\boldsymbol A \cong \boldsymbol B\)。矩阵的等价满足 反身性对称性传递性

矩阵的 标准形

  • 任何非零矩阵 \(\boldsymbol {A}{m \times n}\) 都可以经过有限次初等变换变成形如 \(\begin{bmatrix} \boldsymbol E_r & \boldsymbol O \\ \boldsymbol O & \boldsymbol O\end{bmatrix}{m \times n}\) 的标准形矩阵,其中 \(r = R(\boldsymbol A)\)。
  • 两个等价矩阵具有相同的标准形。

注意:初等列变换之后的矩阵与原矩阵 对应的线性方程组不一定同解

2 行列式

2.1 行列式的基本量及简单计算

行列式的主要定义 / 基本量大都与矩阵相同。下面只给出不同于矩阵的基本量 / 定义。

基本量:对于元素 \(a_{ij}\),\(i\) 称为 行标 ,\(j\) 称为 列标 ;从元素 \(a_{11}\) 到元素 \(a_{nn}\) 连线上的一系列元素称为其 主对角线


二阶行列式的计算:二阶行列式的值等于 主对角线元素的积 减去 副对角线元素的积

二阶行列式与二元线性方程组解的联系:

定义行列式:
\[D = \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix} \quad D_1 = \begin{vmatrix} b_1 & a_{12}\\ b_2 & a_{22} \end{vmatrix} \quad D_2 = \begin{vmatrix} a_{11} & b_1\\ a_{21} & b_2 \end{vmatrix} \]

称 \(D\) 为二元线性方程组的 系数行列式,则其解可以表示为:
\[\begin{cases} x_1 = \dfrac{D_1}{D}\\ x_2 = \dfrac{D_2}{D} \end{cases} \]


三元行列式的计算:
\[\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33} \end{vmatrix} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} + a_{13}a_{21}a_{32} - a_{13}a_{22}a_{31} - a_{12}a_{21}a_{33} - a_{11}a_{23}a_{32} \]

定义行列式:
\[D = \begin{vmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{vmatrix} \quad D_1 = \begin{vmatrix} b_1 & a_{12} & a_{13}\\ b_2 & a_{22} & a_{23}\\ b_3 & a_{32} & a_{33} \end{vmatrix} \]

\(D_2\) 和 \(D_3\) 的定义同理,则:
\[\begin{cases} x_1 = \dfrac{D_1}{D} \\ x_2 = \dfrac{D_2}{D} \\ x_3 = \dfrac{D_3}{D} \end{cases} \]


定义 \(n\) 阶行列式中元素 \(a_{ij}\) 的 余子式 为划去行列式中该元素所在的第 \(i\) 行和第 \(j\) 列剩余元素相对位置不变所构成的 \(n-1\) 阶行列式,记为 \(M_{ij}\)。定义元素 \(a_{ij}\) 的 代数余子式
\[A_{ij} = (-1)^{i+j} M_{ij} \]

则 \(n\) 阶行列式的计算:
\[\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} = a_{11}A_{11} + a_{12}A_{12} + \cdots + a_{1n}A_{1n} \]

这也称为 \(n\) 阶行列式按第 \(1\) 行的 展开法则 。同理,\(n\) 阶行列式可以按照任意一行(列)进行展开。

第 \(i\) 行展开法则为:
\[D_n = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots + a_{in}A_{in}(i = 1,2, \cdots,n) \]

第 \(i\) 列展开法则同理,这里不做赘述。

2.2 行列式的性质

转置行列式

将原行列式同序数的行和列互换(按照主对角线对称),可以得到其 转置行列式 ,记为 \(D^{\text{T}} = \mathrm{det}(a_{ij}'),D = \mathrm{det}(a_{ij})\),则 \(a_{ij}' = a_{ji}\)。

行列式与它的转置行列式 相等 ,即 \(D = D^{\text{T}}\)。

行列式的初等变换 (严格上不能这么叫,我只是类比矩阵取了个名字方便记忆):

  • \(r_i \longleftrightarrow r_j(c_i \longleftrightarrow c_j)\):\(D \to -D\)。推论:两行(列)相同,则行列式的值为 \(0\)。
  • \(k \times r_i(k \times c_i)\):\(D \to kD\)。推论:行列式的某一行(列)中所有元素的公因子可以提到行列式符号的前面;如果行列式中有两行(列)对应元素成比例,则行列式的值为 \(0\)。
  • 若行列式的其中一行所有元素都可以拆为两数之和,则该行列式等于对应的两个行列式相加。(具体不做赘述)
  • 行列式的某一行(列)中所有元素乘以同一个数 \(k\) 加到另一行(列)对应的元素上,行列式的值不变。

针对 代数余子式 的特殊性质:

行列式的某一行(列)的元素与另一行(列)对应元素的代数余子式的乘积之和等于 \(0\),即:
\[a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots + a_{in}A_{jn} = 0 ( i \ne j;i,j = 1,2,\cdots,n) \]

列同理。

注:计算带有系数的余子式之和时,可以考虑根据原行列式构造新的行列式然后求解。(详见课本 P36 P37)

2.3 行列式的计算技巧

一些特殊的行列式:

  • 下三角行列式 的值为 其主对角线上值的乘积上三角行列式 同理。
  • 箭形行列式 可采用初等行变换转化为下三角行列式,其第一行的元素分别为 \(a_0,b_1,b_2,\cdots,b_n\),第一列的元素分别为 \(a_0,c_1,c_2 \cdots,c_n\),主对角线上元素为 \(a_0,a_1,a_2,\cdots,a_n\),则行列式的值 \(D_{n + 1} = a_1a_2\cdots a_n\left(a_0 - \sum \limits_{i = 1}^n \dfrac{b_ic_i}{a_i}\right)\)。
  • 范德蒙德行列式 其第 \(i\) 列的第 \(j\) 个元素是 \({x_i}^{j-1}\),可以根据 数学归纳法 证明得到值为 \(\prod \limits_{1 \le j < i \le n}(x_i - x_j)\)。

整体上来说,计算行列式的技巧主要是通过类初等变换进行造 \(0\),然后计算。

一般来讲可以分为 转化为熟悉的行列式(主要是上 / 下三角行列式)变形之后按行(列)展开递推法(最典型的是十字交叉矩阵(课本 P40))数学归纳法 进行证明。

2.4 行列式与矩阵的关系

矩阵的 \(k\) 阶子式

在矩阵 \(\boldsymbol A_{m \times n}\) 中选取 \(k\) 行,\(k\) 列(\(1 \le k \le \min\{m,n\}\)),把位于这些行和列交叉处的 \(k^2\) 个元素按原来的行列次序排成 \(k\) 阶行列式,称为 \(A\) 的一个 \(k\) 阶子式 (简称 子式 ),并称其阶数为 \(k\)。

用记号 \(\boldsymbol A \begin{bmatrix}i_1 & i_2 & \cdots & i_k\\ j_1 & j_2 & \cdots & j_k\end{bmatrix}\) 表示由第 \(i_1,i_2,\cdots,i_k\) 行(其中 \(1 \le i_1 < i_2 < \cdots < i_k \le m\)),第 \(j_1,j_2,\cdots,j_k\) 列(其中 \(1 \le j_1 < j_2 < \cdots < j_k \le n\))交叉处的元素所构成的 \(k\) 阶子式。

考察任意一个非零矩阵 \(\boldsymbol A_{m \times n}\) 的所有子式,必然存在一个自然数 \(r(r \le \min\{m,n\})\),满足:

  • \(\boldsymbol A\) 有 \(r\) 阶 非零 子式;
  • \(\boldsymbol A\) 没有更高阶的 非零 子式,即 \(\boldsymbol A\) 的 \(r + 1\) 阶子式(如果有的话)均为 \(0\)。

则 \(r\) 即为此时 \(\boldsymbol A\) 的秩。且此时若 \(\boldsymbol A\) 为 \(n\) 阶方阵,则 \(R(\boldsymbol A) = n\) 当且仅当 \(|\boldsymbol A| \ne 0\)。

2.5 行列式与线性方程组解的判定的关系

考虑用行列式来刻画线性方程组解的判定。

克拉默法则

\(n\) 元线性方程组有且只有唯一解的充要条件是系数行列式 \(D \ne 0\) ,且此时 \(R(\boldsymbol A) = R(\boldsymbol B) = n\)。

同理对于 \(n\) 元 齐次 线性方程组,有且只有零解 的充要条件是系数行列式 \(D \ne 0\)。

总结:

对于一个 \(n\) 元线性方程组,其解的判定:

  • 无解:充要条件 \(R(\boldsymbol A) < R(\boldsymbol B)\) 或 \(R(\boldsymbol A) \ne R(\boldsymbol B)\),必要不充分条件 \(D = 0\)。
  • 有解:
    • 有唯一解:充要条件 \(R(\boldsymbol A) = R(\boldsymbol B) = n\) 或 \(D \ne 0\)。
    • 有无穷多解:充要条件 \(R(\boldsymbol A) = R(\boldsymbol B) < n\),必要不充分条件 \(D =0\)。

对于一个 \(n\) 元 齐次 方程组,其解的判定:

  • 无解:充要条件 \(R(\boldsymbol A) < R(\boldsymbol B)\) 或 \(R(\boldsymbol A) \ne R(\boldsymbol B)\),必要不充分条件 \(D = 0\)。
  • 有解:
    • 有且只有零解:充要条件 \(R(\boldsymbol A) = R(\boldsymbol B) = n\) 或 \(D \ne 0\)。
    • 有非零解:充要条件 \(R(\boldsymbol A) = R(\boldsymbol B) < n\),必要不充分条件 \(D =0\)。

3 矩阵

3.1 矩阵的运算及运算性质

矩阵的加法

运算:两个矩阵的加法是其对应位置的元素分别相加。

性质:矩阵加法满足 交换律、结合律、加 \(\mathbf 0\) 不变性对称性(与负矩阵相加为零矩阵)

矩阵的数乘

运算:一个数乘一个矩阵是矩阵中的 每个元素 与这个数相乘。

性质:矩阵数乘满足 结合律(\(\lambda (\mu \boldsymbol A) = (\lambda \mu )\boldsymbol A = \mu(\lambda \boldsymbol A)\))矩阵对于数的分配律数对矩阵的分配律

矩阵与矩阵的乘法

运算:两个矩阵相乘的结果矩阵的第 \(i\) 行第 \(j\) 列的元素的值是第一个矩阵第 \(i\) 行的元素 与 第二个矩阵第 \(j\) 列对应的元素 分别相乘 再相加的结果,即:
\[c_{ij} = \sum \limits_{k = 1}^s a_{ik}b_{kj} \]

性质:矩阵与矩阵的乘法满足 结合律、左右分配律、数乘结合律(\(\lambda(\boldsymbol{AB}) = (\lambda \boldsymbol A) \boldsymbol B = \boldsymbol A (\lambda \boldsymbol B)\))、乘单位矩阵不变性乘零矩阵得 零性

注意:矩阵与矩阵的乘法 不满足交换律

矩阵的转置

运算:矩阵的转置与行列式的转置类似,是把矩阵的元素沿着主对角线对称之后的结果。

性质:

  • 矩阵的转置的转置是原矩阵,即 \((\boldsymbol A^{\text{T}})^{\text{T}} = \boldsymbol A\)。
  • 矩阵加法的转置是两个矩阵分别转置再相加,即 \((\boldsymbol A + \boldsymbol B)^{\text{T}} = \boldsymbol A ^{\text{T}} + \boldsymbol B^{\text{T}}\)。
  • 数乘矩阵的转置是这个数乘以这个矩阵的转置,即 \((\lambda \boldsymbol A)^{\text{T}} = \lambda \boldsymbol A^{\text{T}}\)。
  • 矩阵与矩阵相乘之后的转置等于后矩阵的转置乘前矩阵的转置 ,即 \((\boldsymbol{AB})^{\text{T}} = \boldsymbol B^{\text{T}} \boldsymbol A^{\text{T}}\)。

方阵的幂

运算:方阵的幂是 \(k\) 个方阵连乘积的结果。

规定:\(\boldsymbol A^0 = \boldsymbol E(|\boldsymbol A| \ne 0)\),可类比指数的运算来记忆。

性质:

  • \(\boldsymbol A^m \boldsymbol A^n = \boldsymbol A^{m + n}\)。
  • \((\boldsymbol A^m)^n = \boldsymbol A^{mn}\)。

其中 \(m,n\) 为非负整数。可以完全类比指数的运算来记忆。

注意:当 \(\boldsymbol{AB} = \boldsymbol{BA}\)(即 \(A\) 与 \(B\) 可交换)时,有
\[(\boldsymbol A + \boldsymbol B)^2 = \boldsymbol A^2 + 2\boldsymbol{AB} + \boldsymbol B^2 \]

即满足 完全平方和公式

同时也满足 二项式定理
\[(\boldsymbol A +\boldsymbol B)^n = \sum \limits_{k = 0}^n \boldsymbol A^{n-k}\boldsymbol B^k \]
注:求解方阵的幂时,可以考虑 数学归纳法 。同时对于上三角矩阵,可以写成 \(a \boldsymbol E + \boldsymbol B\) 的形式,可能会有助于解题。

方阵的行列式

性质:

  • 方阵的转置的行列式就是方阵的行列式的转置(标量的转置是它自己),即 \(|\boldsymbol A^T| = |\boldsymbol A|^T\)。
  • \(|\lambda \boldsymbol A| = \lambda^n |\boldsymbol A|\),注意将这个跟矩阵转置的性质第三条区分。
  • \(|\boldsymbol{AB}| = |\boldsymbol A||\boldsymbol B|\)。

3.2 特殊矩阵

伴随矩阵

定义:对于每个元素用其代数余子式替代它本身得到的 方阵

性质:

  • \(\boldsymbol A \boldsymbol A^* = \boldsymbol A^* \boldsymbol A = |\boldsymbol A| \boldsymbol E\);
  • 当 \(|\boldsymbol A| \ne 0\) 时,有 \(|\boldsymbol A^*| = |\boldsymbol A|^{n-1}\)。

对角矩阵

定义:当 \(i \ne j\) 时,\(a_{ij} = 0\) 的 方阵

性质:若 \(\boldsymbol A_1,\boldsymbol A_2\) 为同阶对角矩阵,则 \(\lambda \boldsymbol A_1\boldsymbol A_1 + \boldsymbol A_2,\boldsymbol A_1\boldsymbol A_2\) 和 \(A_1^ T\) 仍然是同阶对角矩阵矩阵。

三角矩阵

定义:只有上三角或下三角有元素(其它为 \(0\))的 方阵

性质:若 \(\boldsymbol A_1,\boldsymbol A_2\) 为同阶同结构的三角矩阵,则 \(\lambda \boldsymbol A_1,\boldsymbol A + \boldsymbol B,\boldsymbol{AB}\) 仍然是 同阶同结构 的三角矩阵,且若 \(\boldsymbol A\) 为上(下)三角矩阵,则 \(A^{\text{T}}\) 为下(上)三角矩阵。

数量矩阵

定义:主对角线 上元素全部 相等 的 \(n\) 阶对角矩阵,简称 \(a\boldsymbol E\)。

性质:

  • 数量矩阵 \(\boldsymbol A\) 左乘 / 右乘(如果可以乘)矩阵 \(\boldsymbol B\),等于以数 \(a\) 乘矩阵 \(\boldsymbol B\),即 \(\boldsymbol{AB} = a \boldsymbol B\) 或 \(\boldsymbol{BA} = a \boldsymbol B\)。
  • 对任意正整数 \(m\),有 \((a\boldsymbol E)^m = a^m \boldsymbol E\)。注意类比方阵的行列式性质第二条以及与矩阵转置的性质第三条区分。

对称与反对称矩阵

定义:\(\boldsymbol A^{\text{T}} = \boldsymbol A\) 或沿着主对角线元素对称的 方阵对称矩阵 ;\(\boldsymbol A^{\text{T}} = -\boldsymbol A\) 或沿着主对角线元素 对称相反 的方阵是 反对称矩阵

性质:

  • 若 \(\boldsymbol A_1,\boldsymbol A_2\) 为同阶对称矩阵,则 \(\lambda \boldsymbol A_1 , \boldsymbol A_1 + \boldsymbol A_2 , \boldsymbol A_1^T\) 仍然是对称矩阵。
  • 若 \(\boldsymbol A_1,\boldsymbol A_2\) 为同阶反对称矩阵,则 \(\lambda \boldsymbol A_1 , \boldsymbol A_1 + \boldsymbol A_2 , \boldsymbol A_1^T\) 仍然是反对称矩阵。
  • 反对称矩阵的主对角线元素均为 \(0\)

注意:

  • \(\boldsymbol A_1\boldsymbol A_2\) 不一定是对称矩阵(反对称矩阵) 。即(反)对称矩阵的不变性对于矩阵乘法 不一定适用
  • 任何一个方阵均可表示为一个对称矩阵与一个反对称矩阵之和。

3.3 初等矩阵

定义:对 \(n\) 阶单位矩阵做一次初等变换所得的矩阵称为 \(n\) 阶 初等矩阵

分类:根据矩阵的 \(3\) 种初等变换,可以将初等矩阵分为 \(3\) 类:初等对换矩阵、初等倍乘矩阵初等倍加矩阵

  • 初等对换矩阵 :将单位矩阵 \(\boldsymbol E\) 的第 \(i,j\) 两行对调(或第 \(i,j\) 两列对调)后得到的矩阵,记为 \(\boldsymbol E(i,j)\)。
  • 初等倍乘矩阵 :以数 \(k(k \ne 0)\) 乘单位矩阵 \(E\) 的第 \(i\) 行(或第 \(i\) 列)后得到的矩阵,记为 \(\boldsymbol E((k)i)\)。
  • 初等倍加矩阵 :将单位矩阵 \(\boldsymbol E\) 的第 \(i\) 行乘以数 \(k\) 加到第 \(j\) 行(或将第 \(i\) 列乘以数 \(k\) 加到第 \(j\) 列)后得到的矩阵,记为 \(\boldsymbol E(r_j + kr_i)\) 或 \(\boldsymbol E(c_i + k c_j)\)。

性质:对 \(m\times n\) 矩阵 \(\boldsymbol A\) 实施一次初等行(列)变换,相当于在 \(\boldsymbol A\) 的左(右)边乘以相应的 \(m(n)\) 阶初等矩阵。

注:初等行变换 对应在 \(\boldsymbol A\) 左边 乘以 \(m\) 阶初等矩阵;初等列变换 对应在 \(\boldsymbol A\) 右边 乘以 \(n\) 阶初等矩阵。

3.4 逆矩阵

定义:满足对于 \(n\) 阶方阵(矩阵) \(\boldsymbol A\) 有 \(\boldsymbol{AB} = \boldsymbol{BA} = \boldsymbol E\) 的 \(n\) 阶矩阵 \(\boldsymbol B\)。此时 \(\boldsymbol A\) 称为 可逆矩阵 ,\(\boldsymbol B\) 称为 \(\boldsymbol A\) 的 逆矩阵

注:\(n\) 阶矩阵 不一定可逆 ,若可逆,则 逆矩阵唯一

性质(均对于 可逆 矩阵而言):

  • \(A\) 的逆的逆是它本身,即 \((\boldsymbol A^{-1})^{-1} = \boldsymbol A\)。
  • 数乘矩阵的逆是用这个数的 倒数 乘以矩阵的逆矩阵,即 \((\lambda \boldsymbol A)^{-1} = \dfrac 1 \lambda \boldsymbol A^{-1}\)。
  • \(A\) 的转置的逆是它的逆的转置(转置矩阵一定可逆 ),即 \((\boldsymbol A^{\text{T}})^{-1} = (\boldsymbol A^{-1})^{\text{T}}\)。
  • 两个可逆矩阵乘积的逆是后一个矩阵的逆乘以前一个矩阵的逆(乘积矩阵一定可逆 ),即 \((\boldsymbol{AB})^{-1} = \boldsymbol B^{-1}\boldsymbol A^{-1}\)。

总结:

逆矩阵的运算性质第 1、2、4 条都可以类比 转置矩阵的运算性质 第1、3、4 条。需要注意的是对于性质 2(转置矩阵的性质 3),逆矩阵前置系数要更换为原系数的倒数。

运算性质 3 是转置运算和逆运算的关系,可以认为它们 满足交换律,或者没有明确的先后运算优先级(改变运算顺序结果不变)。
特殊矩阵的逆:

  • 对角矩阵可逆的充要条件是 主对角元均不为 \(0\) ,且其逆矩阵是原 对角线上元素取倒数 的结果。
  • 三角矩阵可逆的充要条件也是 主对角元均不为 \(0\),且其逆矩阵与对角矩阵变换规律相同。
  • 可逆对称矩阵 \(\boldsymbol A\) 的逆矩阵 \(\boldsymbol A^{-1}\) 仍是对称矩阵,可逆反对称矩阵的逆矩阵仍然是反对称矩阵,奇数阶反对称矩阵不可逆。
  • 初等矩阵 一定是可逆矩阵 ,其逆矩阵是 同型 初等矩阵。

注:若方阵 \(\boldsymbol A\) 的行列式 \(|\boldsymbol A| \ne 0\),则称 \(\boldsymbol A\) 为 非奇异矩阵 ,否则称 \(\boldsymbol A\) 为 奇异矩阵

计算:

  • 利用 伴随矩阵 求逆矩阵:\(n\) 阶矩阵 \(\boldsymbol A\) 可逆的 充要条件是 \(|\boldsymbol A| \ne 0\),即 \(\boldsymbol A\) 是 非奇异矩阵,且当 \(\boldsymbol A\) 可逆时,有 \(\boldsymbol A^{-1} = \dfrac{1}{|A|} \boldsymbol A^*\)
  • 利用 初等变换 求逆矩阵:可逆矩阵 \(A\) 经过有限次初等 行变换 可化为单位矩阵 \(E\),即可以用有限个初等矩阵 左乘 \(A\) 化为 \(E\)。那么考虑构造矩阵 \(\left(\begin{array}{c:c}\boldsymbol A & \boldsymbol E\end{array}\right)\),对矩阵进行初等行变换,得到 \(\left(\begin{array}{c:c}\boldsymbol E & \boldsymbol A^{-1}\end{array}\right)\),可得到其逆矩阵。

3.4 分块矩阵

定义:通过横竖线将矩阵分成若干个小块,每一小块叫做原矩阵的 分块矩阵

运算:

  • 加法:每一小块的矩阵单独相加,与矩阵的加法相同。
  • 数乘:每一小块的矩阵分别乘上这个数,与矩阵的数乘相同。
  • 乘法:对于 \(m \times l\) 矩阵 \(A\) 和 \(l \times n\) 矩阵 \(B\),分别将它们分块成 \(s \times t\) 矩阵和 \(t \times r\) 矩阵,二者相乘的结果矩阵 \(C_{ij} = \sum \limits_{k = 1}^t A_{ik}B_{kj}(i = 1,\cdots,s;j=1,\cdots r)\)。
  • 转置:先转置 块内 ,再转置 块外

常用的分块形式:

  • 对角 分块:使得原矩阵的分块矩阵在主对角以外均为零子块。此时满足 \(|\boldsymbol A| = |\boldsymbol A_1||\boldsymbol A_2|\cdots|\boldsymbol A_s|\),逆矩阵是分块矩阵的每一个非零矩阵求逆。
  • 分块:将每一行分为一块。
  • 分块:将每一列分为一块。

分块矩阵求逆矩阵:

将逆矩阵设出来,然后根据 \(\boldsymbol P \boldsymbol P^{-1} = \boldsymbol E\),写出对应的矩阵乘法的表示式,根据矩阵乘法的运算法则求出设出的矩阵 \(\boldsymbol P^{-1}\)。(详见课本 P90)

3.5 矩阵方程 & 多项式

矩阵方程有多种形式,当 \(\boldsymbol X\) 左边和右边的矩阵可逆时,可以在等号右边 左乘右乘 对应矩阵的 逆矩阵 来求出其解。

对于一般形式为 \(\boldsymbol{AX} = \boldsymbol B\) 的矩阵方程,有两种解法:

  • 等号两边同时 左乘 \(\boldsymbol A^{-1}\),从而有 \(\boldsymbol{AX} = \boldsymbol B \to \boldsymbol X = \boldsymbol A^{-1}\boldsymbol B\)。
  • 构造 矩阵 \(\left(\begin{array}{c:c}\boldsymbol A & \boldsymbol B\end{array}\right)\),通过初等行变换得到 \(\left(\begin{array}{c:c}\boldsymbol E & \boldsymbol A^{-1} \boldsymbol B\end{array}\right)\)。

对于矩阵方程 \(\boldsymbol{AX} = \boldsymbol B\),考察其解的判定:

  • 有解:\(R(\boldsymbol A) = R(\boldsymbol A,\boldsymbol B) \le n\)。
    • 唯一解 :\(R(\boldsymbol A) = R(\boldsymbol A,\boldsymbol B) = n\)。
    • 无穷多个解 :\(R(\boldsymbol A) = R(\boldsymbol A,\boldsymbol B) < n\)。\(\boldsymbol{AX} = \boldsymbol B\) 的任一解可以表示为 原方程 的一个 特解 与其 导出方程 \(\boldsymbol{AX} = \boldsymbol O\) 的 基础解 的和。
  • 无解:\(R(\boldsymbol A) \ne R(\boldsymbol A,\boldsymbol B)\)。

4 向量

4.1 基本量与基本定义

比较简单的略过。

线性组合:对于给定的向量组 \(\boldsymbol{A:a_1,a_2,\cdots,a_m}\),对任何一组实数 \(c_1,c_2,\cdots,c_m\),称 \(c_1 \boldsymbol{a_1} + c_2 \boldsymbol{a_2} + \cdots + c_m \boldsymbol{a_m}\) 为向量组 \(A\) 的一个 线性组合 ,\(c_1,c_2,\cdots,c_m\) 称为这个线性组合的系数。

线性表示:给定向量组 \(\boldsymbol{A:a_1,a_2,\cdots,a_m}\) 和向量 \(\boldsymbol{b}\),如果存在一组数 \(\lambda_1,\lambda_2,\cdots,\lambda_m\),使得
\[\boldsymbol b = \lambda_1 \boldsymbol{a_1} + \lambda_2 \boldsymbol{a_2} + \cdots + \lambda_m \boldsymbol{a_m} \]

则称向量 \(\boldsymbol b\) 是 \(\boldsymbol A\) 的 线性组合 ,或向量 \(\boldsymbol b\) 可以由向量组 \(\boldsymbol A\) 线性表示

若将 向量 变为向量组,若向量组 \(\boldsymbol B\) 能由向量组 \(\boldsymbol A\) 线性表示,即存在 \(k_{ij}\) 使得
\[\boldsymbol{b_j} = k_{1j} \boldsymbol{a_1} + k_{2j} \boldsymbol{a_2} + \cdots + k_{mj} \boldsymbol{a_m} \]

用矩阵写为:
\[\boldsymbol{b_j} = (\boldsymbol{a_1},\boldsymbol{a_2},\cdots,\boldsymbol{a_m}) \begin{pmatrix} k_{1j}\\k_{2j}\\\vdots \\ k_{mj} \end{pmatrix} \]

即向量组 \(\boldsymbol{B}\) 能由向量组 \(\boldsymbol{A}\) 线性表示 ,即 矩阵方程 \(\boldsymbol{B = AK}\) 有解。其中 \(\boldsymbol{K}\) 是向量组 \(\boldsymbol{B}\) 由 \(\boldsymbol{A}\) 线性表示的 系数矩阵

注:

  • 零向量所有向量 线性相关。
  • 任意一个向量都可以由 \(n\) 维 单位坐标向量组 线性表示。(课本 P97)

等价:如果两个向量组 \(\boldsymbol A,\boldsymbol B\),\(\boldsymbol{A}\) 能由 \(\boldsymbol{B}\) 线性表示,且 \(\boldsymbol{B}\) 能由 \(\boldsymbol A\) 线性表示(二者能互相线性表示),则两个向量组 等价 ,记作 \(\boldsymbol A \cong \boldsymbol B\)。向量组的等价满足 反身性对称性传递性

总结:矩阵 的等价含义是一个矩阵可以通过另一个矩阵由 初等变换 得到;向量组 的等价含义是二者能互相 线性表示

4.2 向量组的线性表示

向量 线性表示的充要条件:向量 \(\boldsymbol b\) 能由向量组 \(\boldsymbol A\) 线性表示的充要条件是矩阵 \(\boldsymbol A\) 的秩等于矩阵 \(\boldsymbol B = \left(\begin{array}{c:c}\boldsymbol A & \boldsymbol b\end{array}\right)\),即 \(R(\boldsymbol A) = R(\boldsymbol A,\boldsymbol b)\)。

向量组 线性表示的充要条件:向量组 \(\boldsymbol B\) 能由向量组 \(\boldsymbol A\) 线性表示的充要条件是矩阵 \(A\) 的秩等于矩阵 \((\boldsymbol A,\boldsymbol B)\) 的秩,即 \(R(\boldsymbol A) = R(\boldsymbol A,\boldsymbol B)\)。

向量组等价 的充要条件:两个向量组 \(\boldsymbol A,\boldsymbol B\) 等价的充要条件是 \(R(\boldsymbol A) = R(\boldsymbol B) = R(\boldsymbol A,\boldsymbol B)\)。

向量组线性表示的判定 & 求解:通过上述,可以把求两个向量(组)之间 是否 可以线性表示 / 等价的问题 转化为 矩阵的秩是否相等的问题 ;求解线性表示可以通过构造矩阵 \(\left(\begin{array}{c:c}\boldsymbol A & \boldsymbol B\end{array}\right)\),通过 初等变换 可以将矩阵变为 \(\left(\begin{array}{c:c}\boldsymbol E & \boldsymbol K\end{array}\right)\),即得到 \(\boldsymbol B = \boldsymbol{AK}\) 中所求解的系数矩阵 \(\boldsymbol K\)。

4.3 向量组的线性相关性

基础概念:如果存在一组 不全为 \(0\) 的数 \(k_1,k_2,\cdots,k_m\) 使得对于向量组 \(\boldsymbol A\) 有
\[k_1a_1+ k_2a_2+ \cdots + k_ma_m = 0 \]

则向量组 \(\boldsymbol A\) 线性相关 ,反之则 线性无关

注意:

  • 一个向量组或线性相关或线性无关,二者必居其一
  • 含有 零向量 的向量组 必定 线性相关。

向量组的线性相关性与 齐次线性方程组 解的关系:齐次线性方程组可以写成向量形式,设向量组 \(\boldsymbol A\) 线性组合的系数 \(k_1,k_2,\cdots,k_m\),对该方程组考察其解的判定:

  • 有且只有零解 :向量组 线性无关 ,即 \(k_1 = k_2 = \cdots = k_m = 0\)。
  • 有非零解 :向量组 线性相关 ,即存在一组 不全为零 的系数 \(k_1 \sim k_m\),使得方程组成立。

向量组线性相关的 判定(充要条件)

  • 线性 无关 :矩阵 \(\boldsymbol A\) 的秩 等于 向量个数 \(m\),即 \(R(\boldsymbol A) = m\)。
  • 线性 相关 :矩阵 \(\boldsymbol A\) 的秩 小于 向量个数 \(m\),即 \(R(\boldsymbol A) < m\)。

总结: 齐次线性方程组的解的判定 可以通过 向量组的线性相关性 刻画,也可以由 矩阵的秩系数行列式 来刻画,从而能够将 行列式 - 矩阵 - 向量线性方程组的解 建立联系。

  • 齐次线性方程组 只有零解 \(\iff\) 向量组线性 无关 \(\iff R(\boldsymbol A) = m \iff\) 系数行列式 \(D \ne 0\);
  • 齐次线性方程组 有非零解 \(\iff\) 向量组线性 相关 \(\iff R(\boldsymbol A) < m \iff\) 系数行列式 \(D = 0\)。

向量组线性相关性的 性质

  • 向量组 \(\boldsymbol A\) 有 部分向量线性相关 \(\longrightarrow\) 向量组 \(\boldsymbol A\) 线性相关
  • 线性 无关 的向量组中 任一部分组 线性 无关
  • 向量组 \(\boldsymbol A\) 线性相关 当且仅当 其中 至少有一个向量 可以用其余 \(m - 1\) 个向量 线性表示
  • 若向量 \(\boldsymbol b\) 可由向量组 \(\boldsymbol A\) 线性表示,则向量组 \(\boldsymbol A\) 线性 无关充要条件 是 \(\boldsymbol b\) 可由 \(\boldsymbol A\) 唯一 线性表示。
  • 向量组 \(\boldsymbol A\) 线性 无关 ,向量组 \(\boldsymbol B:\boldsymbol A,\boldsymbol b\) 线性 相关 ,则 \(\boldsymbol b\) 必能由 \(\boldsymbol A\) 线性表示,且表示式 唯一

4.4 向量组的秩

向量组的最大无关组:若从向量组 \(\boldsymbol A\) 中能够选出 \(r\) 个向量 \(\boldsymbol A_0:\boldsymbol a_1,\boldsymbol a_2,\cdots,\boldsymbol a_r\),满足向量组 \(A_0\) 线性无关 ,任取 \(a \in A\),向量组 \(a,A_0\) 线性相关 ,则称 \(\boldsymbol A_0\) 是向量组 \(\boldsymbol A\) 的一个 最大线性无关向量组 ,简称 最大无关组

注:

  • 一个向量组的最大无关组 不一定 唯一。
  • 向量组 \(\boldsymbol A\) 与其最大无关组 \(\boldsymbol A_0\) 等价
  • 向量组的 所有最大无关组彼此等价 ,含有向量的 个数 相等。

向量组的秩:定义向量组最大无关组中 向量的个数向量组的秩

注:

  • 只含有零向量 的向量组 没有 最大无关组,其 秩为 \(0\)
  • \(n\) 维 单位坐标向量组 是 \(n\) 维向量的全体组成的集合 \(\R^n\) 的一个 最大无关组

量组的秩与线性相关性的关系:秩为 \(r\) 的向量组中任何 \(r\) 个 线性无关 的向量组都是 最大无关组。据此可以求解向量组的最大无关组。


向量组 的秩与 矩阵 的秩的关系:矩阵的秩 等于它的 行向量的秩 也等于它的 列向量的秩若向量组 \(\boldsymbol B\) 能由向量组 \(\boldsymbol A\) 线性表示,则向量组 \(\boldsymbol B\) 的秩不大于向量组 \(\boldsymbol A\) 的秩。

向量组的秩 & 最大无关组的 求解 :对向量组构成的 矩阵 进行 初等变换 ,得到的 矩阵的秩就等于向量组的秩 \(r\) ;然后对变换后的 行阶梯形 再进行 初等变换 得到 行最简形 ,选取 \(r\) 个 线性无关 的向量(一般选取 主元列 的向量,保证一定线性无关)即为向量组的 最大无关组 ;通过 行最简形 可以求出 非最大无关组的其余向量最大无关组向量线性表示

5 线性方程组解的结构与向量空间

5.1 齐次线性方程组解的结构

齐次线性方程组的 矩阵形式 :\(\boldsymbol {Ax} = \boldsymbol 0\)。

齐次线性方程组的 基础解系

设 \(\boldsymbol \xi_1,\boldsymbol \xi_2,\cdots,\boldsymbol \xi_r\) 是齐次线性方程组的一组解向量,满足:

  • \(\boldsymbol \xi_1,\boldsymbol \xi_2,\cdots,\boldsymbol \xi_r\) 线性无关
  • 齐次线性方程组的 任意一个解 都可由 \(\boldsymbol \xi_1,\boldsymbol \xi_2,\cdots,\boldsymbol \xi_r\) 线性表示

则称 \(\boldsymbol \xi_1,\boldsymbol \xi_2,\cdots,\boldsymbol \xi_r\) 为齐次线性方程组的一个 基础解系

齐次线性方程组 解的相关性质

  • 若 \(\boldsymbol x = \boldsymbol \xi_1,x = \boldsymbol \xi_2\) 是方程组的解,则 \(\boldsymbol x = \boldsymbol \xi_1 + \boldsymbol \xi_2\) 也是方程组的解。
  • 若 \(\boldsymbol x = \boldsymbol \xi\) 是方程组的解,\(\lambda\) 是任意实数,则 \(\boldsymbol x = \lambda \boldsymbol \xi\) 也是方程组的解。

齐次线性方程组 通解的求解

  1. 首先求出齐次线性方程组的 系数矩阵 \(\boldsymbol A\)。
  2. 对 \(\boldsymbol A\) 进行 初等行变换 化为 行最简形
  3. 通过行最简形求出与齐次线性方程组 同解 的方程组,并找到 主元列
  4. 非主元列 的变量设为 自由变量 \(k\),并根据行最简形和自由变量求出 基础解系 \(\boldsymbol \xi\)。
  5. 通过 基础解系自由变量 表示出方程组的 通解

系数矩阵的 与齐次线性方程组 基础解系中解向量个数 的关系:

  • 当秩 \(r = n\) 时,方程组 仅有零解没有 基础解系。
  • 当 \(r < n\) 时,方程组有 无穷多个非零解存在 基础解系,且它的任意一个基础解系中 解向量的个数 为 \(n - r\)。

注:

  • 由于这里面涉及到齐次线性方程组 解的存在性与唯一性 的判定,实际上可以参考前面的内容,利用 系数矩阵的行列式 进行判断。
  • 注意到 齐次线性方程组求通解的步骤向量组的最大无关组 求解思路几乎一致,这是由于 向量组的线性相关性齐次线性方程组解的存在性和唯一性 存在相关性。同时二者的求解步骤可以关联记忆。

5.2 非齐次线性方程组解的结构

非齐次线性方程组的 矩阵形式 :\(\boldsymbol{Ax} = \boldsymbol b\)。

非齐次线性方程组的 导出组 :将上述矩阵形式中的 \(\boldsymbol b\) 换成 \(0\),得到相应的齐次方程组 \(\boldsymbol{Ax} = 0\),称该 齐次线性方程组非齐次线性方程组导出方程组 ,简称 导出组

非齐次线性方程组 解的相关性质

  • 若 \(\boldsymbol x = \boldsymbol \eta_1\) 和 \(\boldsymbol x = \boldsymbol \eta_2\) 都是 非齐次线性方程组 的解,则 \(\boldsymbol x = \boldsymbol \eta_1 - \boldsymbol \eta_2\) 是其 导出组 的解。
  • 若 \(\boldsymbol x = \boldsymbol \eta\) 是 非齐次线性方程组 的解,\(\boldsymbol x = \boldsymbol \xi\) 是其 导出组 的解,则 \(\boldsymbol x = \boldsymbol \eta + \boldsymbol \xi\) 是 非齐次线性方程组 的解。

非齐次线性方程组的 通解 :若 \(\boldsymbol \eta^*\) 是 非齐次线性方程组 的一个 已知解 ,\(\boldsymbol \xi\) 是其 导出组通解 ,则非齐次线性方程组的 通解 为 \(\boldsymbol x = \boldsymbol \eta^* + \boldsymbol \xi\)。

由此可见,要求非齐次线性方程组的通解,可以先通过「5.2 齐次线性方程组解的结构 - 通解的求解」求出 导出组 的通解,然后取 自由变量 为 \(0\),通过其 增广矩阵 得到 非齐次线性方程组 的一个特解,然后二者相加得到原方程组的通解。

5.3 向量空间

向量的 内积 :设有 \(n\) 维列向量 \(\boldsymbol x=\{x_1,x_2,\cdots,x_n\}^T,\boldsymbol y=\{y_1,y_2,\cdots,y_n\}^T\),令
\[[\boldsymbol x,\boldsymbol y] = x_1y_1 + x_2y_2 + \cdots + x_ny_n \]

即 \(\boldsymbol x\) 的每一位与 \(\boldsymbol y\) 的对应位相乘再相加,称 \([\boldsymbol x,\boldsymbol y]\) 为向量 \(x\) 与 \(y\) 的 内积

向量内积的 矩阵形式
\[[\boldsymbol x,\boldsymbol y] = \boldsymbol x^{\text{T}} \boldsymbol y = (x_1,x_2,\cdots,x_n) \begin{pmatrix}y_1\\y_2\\\vdots \\ y_n \end{pmatrix} \]

行向量的内积可类比定义。

向量内积的 运算律 :满足 对称性 \([\boldsymbol x,\boldsymbol y] = [\boldsymbol y,\boldsymbol x]\) 和 线性性 \([\lambda \boldsymbol x,\boldsymbol y] = \lambda [\boldsymbol x,\boldsymbol y],[\boldsymbol x+\boldsymbol y,\boldsymbol z] = [\boldsymbol x,\boldsymbol z]+[\boldsymbol y,\boldsymbol z]\)。


向量的 范数 :对于 \(n\) 维列向量 \(\boldsymbol x\),令
\[||\boldsymbol x|| = \sqrt{[\boldsymbol x,\boldsymbol x]} = \sqrt{{x_1}^2 + {x_2}^2 + \cdots + {x_n}^2} \]

称 \(||\boldsymbol x||\) 为向量 \(\boldsymbol x\) 的 范数(长度)

规定:当 \(||\boldsymbol x|| = 1\) 时,\(\boldsymbol x\) 为 单位向量

向量长度的 性质

  • 非负性 :当 \(\boldsymbol x \ne \boldsymbol 0\) 时 \(||\boldsymbol x|| > 0\);当 \(\boldsymbol x = \boldsymbol 0\) 时,\(||\boldsymbol x|| =\boldsymbol 0\)。
  • 齐次性 :\(||\lambda \boldsymbol x || = |\lambda|\,\ ||\boldsymbol x||\)。
  • 三角不等式 :\(|| \boldsymbol x + \boldsymbol y || \le ||\boldsymbol x|| + ||\boldsymbol y||\)。

向量的 夹角

向量的内积满足 施瓦茨不等式
\[[\boldsymbol x,\boldsymbol y]^2 \le [\boldsymbol x,\boldsymbol x][\boldsymbol y,\boldsymbol y] \Longrightarrow \left|\dfrac{[\boldsymbol x,\boldsymbol y]}{||\boldsymbol x||\,\ ||\boldsymbol y||}\right| \le 1(当~ ||\boldsymbol x|| \,\ ||\boldsymbol y|| \ne 0) \]

所以设 \(\boldsymbol x \ne \mathbf 0,\boldsymbol y \ne \mathbf 0\),令
\[\theta = \arccos \dfrac{[\boldsymbol x,\boldsymbol y]}{||\boldsymbol x|| \,\ ||\boldsymbol y||} \]

\\theta 为向量 \(\boldsymbol x\) 和 \(\boldsymbol y\) 的夹角。


向量的 正交 :若两个向量 内积为 \(0\) ,则两个向量 正交 ,即 \([\boldsymbol x,\boldsymbol y] = 0\)。

注:

  • 零向量任何向量 都正交。
  • 二维 \(\R^2\) 和三维 \(\R^3\) 中的向量正交就是我们通常意义下的 垂直

正交向量组 :若非零向量组中的向量 两两正交 ,则称该向量组为 正交向量组

标准向量组单位向量 组成的正交向量组称为 标准向量组单位正交向量组

正交向量组的 性质 :若 非零 向量组为 正交向量组 ,则向量组 线性无关

注:向量组线性无关一个向量组是正交向量组 不互为充分必要条件 ,正交向量组 一定 线性无关,但线性无关的向量组 不一定 正交。

施密特正交化 :本质上是构造一个 正交向量组,使得原向量组与等价。

思路(以二维平面内的向量为例):

考虑对于向量 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2\),固定 \(\boldsymbol \beta_1 = \boldsymbol \alpha_1\),找到一个 \(\boldsymbol \beta_2\) 与 \(\boldsymbol \beta_1\) 正交。

首先在二维平面 \(\R^2\) 中画出向量 \(\boldsymbol \alpha_1\) 和 \(\boldsymbol \alpha_2\),如下图所示:

将其中一个向量对另一个向量进行投影:

得到 \(\R^2\) 的一组正交基,定义为 \(\boldsymbol \beta_1,\boldsymbol \beta_2\)。

那么根据几何关系有:
\[\boldsymbol \alpha_1,\boldsymbol \alpha_2 \xrightarrow{\text{schmidt}} \begin{cases} \boldsymbol \beta_1 = \boldsymbol \alpha_1\\ \boldsymbol \beta_2 = \boldsymbol \alpha_2 - \overline{\boldsymbol \alpha_2} = \boldsymbol \alpha_2 - k_1\boldsymbol \beta_1 \end{cases} \]

其中 \(\overline{\boldsymbol \alpha_2}\) 表示 \(\boldsymbol \alpha_2\) 在 \(\boldsymbol \alpha_1\) 或 \(\boldsymbol \beta_1\) 上的投影向量。

由于 \([\boldsymbol \beta_1,\boldsymbol \beta_2] = 0\),即 \(\boldsymbol \beta_1 \cdot \boldsymbol \beta_2 = 0\),所以:
\[(\boldsymbol \alpha_2 - k_1\boldsymbol \beta_1)\cdot \boldsymbol \beta_1 = 0 \to k_1 = \dfrac{[\boldsymbol \alpha_2,\boldsymbol \beta_1]}{[\boldsymbol \beta_1,\boldsymbol \beta_1]} \]

那么 \(\boldsymbol \beta_2 = \boldsymbol \alpha_2 - \dfrac{[\boldsymbol \alpha_1,\boldsymbol \beta_1]}{[\boldsymbol \beta_1,\boldsymbol \beta_1]} \boldsymbol \beta_1\)。

同理,可以将这个过程类比到 \(\R^3,\R^4,\cdots,\R^n\),即对于 \(\boldsymbol \beta_r\),我们可以用原向量 \(\boldsymbol \alpha_r\) 减去 每一维空间 \(\R^n\) 上 \(\boldsymbol \alpha_r\) 在前一个向量 \(\boldsymbol \beta_{n-1}\) 的投影向量。

从而得到对于一组线性无关的向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\cdots,\boldsymbol \alpha_r\),有:
\[\begin{aligned} & \boldsymbol \beta_1 = \boldsymbol \alpha_1 \\ & \boldsymbol \beta_2 = \boldsymbol \alpha_2 - \dfrac{[\boldsymbol \alpha_2,\boldsymbol \beta_1]}{[\boldsymbol \beta_1,\boldsymbol \beta_1]} \boldsymbol \beta_1\\ & \cdots\\ & \boldsymbol \beta_r = \boldsymbol \alpha_r - \dfrac{[\boldsymbol \alpha_r,\boldsymbol \beta_1]}{[\boldsymbol \beta_1,\boldsymbol \beta_1]} \boldsymbol \beta_1 - \dfrac{[\boldsymbol \alpha_r,\boldsymbol \beta_2]}{[\boldsymbol \beta_2,\boldsymbol \beta_2]} \boldsymbol \beta_2 - \cdots - \dfrac{[\boldsymbol \alpha_r,\boldsymbol \beta_{r-1}]}{[\boldsymbol \beta_{r-1},\boldsymbol \beta_{r-1}]} \boldsymbol \beta_{r-1} \end{aligned} \]

易证两个向量组 等价

*给定若干个向量,求若干个向量让它与给定向量构成正交向量组 / 标准向量组:

  • 先写出给定向量构成的矩阵 \(\boldsymbol A\),那么根据正交可知,所求向量均满足 \(\boldsymbol{Ax} = \mathbf 0\);
  • 从而将问题转化为 求齐次线性方程组的基础解系 ,那么通过「5.1 齐次线性方程组解的结构 - 齐次线性方程组 通解的求解」求出该齐次线性方程组的基础解系;
  • 对基础解系施行 施密特正交化 ,从而得到正交且满足题意的向量组,与给定向量构成 正交向量组
  • 若题目求 标准向量组 ,则在上一步的基础上将向量 单位化 ,具体来说可以将向量中的每个分向量除以 向量的范数(长度) ,得到 标准向量组

正交矩阵 :如果 \(n\) 阶 方阵 \(\boldsymbol A\) 满足 \(\boldsymbol A^{\text{T}} \boldsymbol A = \boldsymbol E\),即 \(\boldsymbol A^{\text{T}} = \boldsymbol A^{-1}\),则称 \(\boldsymbol A\) 为 正交矩阵

正交变换 :对于正交矩阵 \(\boldsymbol A\),称线性变换 \(\boldsymbol y = \boldsymbol{Ax}\) 为 正交变换

正交矩阵的 判定 :方阵 \(\boldsymbol A\) 是正交矩阵的充要条件是 \(\boldsymbol A\) 的列(行)向量都是 单位向量 ,且 两两正交

正交变换的 性质 :正交变换保持向量的 长度不变


运算的 封闭性 :对于集合 \(V\),若 \(\alpha \in V\),且 \(\alpha\) 经过某种 运算 得到的 \(\beta \in V\),则称集合 \(V\) 对该运算具有 封闭性

\(\R^n\) 的 子空间 :若 \(V\) 是 \(\R^n\) 的非空子集,且 \(V\) 对于 向量加法数乘 两种运算 封闭 ,则称 \(V\) 是 \(\R^n\) 的一个 子空间

向量空间中的相关定义:对于 \(\R^n\) 的一个子空间 \(V\),若 \(V\) 中的某向量组满足 该向量组线性无关 且 \(V\) 中的任意一个向量都可由该向量组线性表示 ,则称该向量组为 \(V\) 的一个 ,向量组中向量的 个数 \(r\) 称为 \(V\) 的 维数 ,记作 \(\text{dim}V = r\),并称 \(V\) 为一个 \(r\) 维向量子空间

规定:若子空间 \(V\) 中 没有基 ,则 \(\text{dim}V = 0\)。
注:零维向量子空间中只含有一个零向量。

正交基 :由 两两正交 的向量组所组成的基称为 正交基

标准正交基 :由 单位向量 所组成的 正交基 称为 标准正交基

向量空间与向量的最大无关组 & 秩的关系:\(V\) 的基 是可以看成 \(V\) 的一个 最大无关组 ,\(\text{dim}V\) 是它的 ,所以 \(V\) 由 \(n\) 维向量构成时,\(\text{dim}V \le n\)。

注:判断一个数量为 \(n\) 的向量组 \(\boldsymbol A\) 是否为 \(\R^n\) 的一个基只需要判断 向量组是否线性无关 即可,因为在 \(n\) 维空间中,任意一个 \(n\) 个向量的向量组都可以表示任意一个该空间内的其它向量。

6 矩阵的特征值和特征向量

6.1 特征值与特征向量

特征值特征向量

设 \(\boldsymbol A\) 为 \(n\) 阶 方阵 ,如果存在数 \(\lambda\) 和 \(n\) 维 非零向量 \(\boldsymbol \alpha\) 使得关系式
\[\boldsymbol{A\alpha} = \lambda \boldsymbol{\alpha} \]

成立,则称 \(\lambda\) 为 \(n\) 阶方阵 \(\boldsymbol A\) 的特征值,非零向量 \(\boldsymbol\alpha\) 称为 \(\boldsymbol A\) 的 对应于特征值 \(\lambda\) 的 特征向量

特征方程特征多项式

将上述等式变形得到
\[(\boldsymbol A - \lambda \boldsymbol E) \boldsymbol \alpha = \boldsymbol 0 \]

所以 \(\boldsymbol \alpha\) 是齐次线性方程组
\[(\boldsymbol A - \lambda \boldsymbol E) \boldsymbol x = \boldsymbol 0 \]

非零解,所以有
\[|\boldsymbol A - \lambda \boldsymbol E | = 0 \]

该式是以 \(\lambda\) 为未知量的一元 \(n\) 次方程,称为方阵 \(\boldsymbol A\) 的 特征方程 ,\(|\boldsymbol A - \lambda \boldsymbol E|\) 是 \(\lambda\) 的 \(n\) 次多项式,记作 \(f(\lambda)\),称为方阵 \(\boldsymbol A\) 的 特征多项式 。\(\boldsymbol A\) 的 特征值 就是特征方程的 ,解的 个数 等于方程的 次数 。\(n\) 阶方阵有 \(n\) 个特征值。


特征值与特征向量的 计算

  1. 计算 \(\boldsymbol A\) 的 特征多项式 \(|\boldsymbol A - \lambda \boldsymbol E|\),令特征多项式为 \(0\),求出特征方程的 全部根 ,即 \(\boldsymbol A\) 的 全部特征值
  2. 对于每一个 \(\lambda\),求出齐次线性方程组 \((\boldsymbol A - \lambda \boldsymbol E)\boldsymbol x = \mathbf 0\) 的一个 基础解系 \(\boldsymbol \eta_1,\boldsymbol \eta_2,\cdots,\boldsymbol \eta_s\)。
  3. \(\boldsymbol A\) 的 对应于 \(\lambda\) 的 全部特征向量 为 \(k_1 \boldsymbol \eta_1 + k_2 \boldsymbol \eta_2 + \cdots + k_s \boldsymbol \eta_s\)。其中 \(k_1\sim k_s\) 是任意 不全为 \(0\) 的常数。

特征值与特征向量的 相关性质

  • 单位矩阵 的特征值为 \(1\),其特征向量为 \(\R^n\) 中的 全部向量
  • 对角矩阵 的全部特征值是其 主对角线上的各元素
  • 对于 可逆矩阵 \(\boldsymbol A\),其特征值 \(\lambda \ne 0\)。
  • 对于 可逆矩阵 \(\boldsymbol A\),\(\dfrac 1 {\lambda}\) 是 \(\boldsymbol A^{-1}\) 的特征值,若 \(\boldsymbol A\) 的对应于 \(\lambda\) 的特征向量为 \(\boldsymbol \alpha\),则 \(\boldsymbol A^{-1}\) 对应于 \(\dfrac 1 {\lambda}\) 的特征向量也为 \(\boldsymbol \alpha\)。
  • 对于上一条同样的可逆矩阵,\(\dfrac{|\boldsymbol A|}{\lambda}\) 是 \(\boldsymbol A^*\) 的特征值,\(\boldsymbol A^*\) 的对应于特征值 \(\dfrac{|\boldsymbol A|}{\lambda}\) 的特征向量也为 \(\boldsymbol \alpha\)。
  • 对于 方阵 \(\boldsymbol A\),其特征值为 \(\lambda\),则 \(\boldsymbol A^2\) 的特征值是 \(\lambda^2\),\(\boldsymbol A^k\) 的特征值是 \(\lambda^k\),\(\varphi(\lambda) = a_0 + a_1 \lambda + \cdots + a_m \lambda^{m}\) 是 \(\varphi(\boldsymbol A) = a_0 \boldsymbol E + a_1 \boldsymbol A + \cdots + a_m \boldsymbol A^m\) 的特征值。
  • 方阵 对应于 不同特征值 的特征向量 线性无关

方阵的迹 :\(n\) 阶 方阵主对角线 上的 \(n\) 个元素 之和 称为该方阵的 ,记作 \(\text{tr}(\boldsymbol A)\)。

与特征值的关系:特征值之 等于方阵的

行列式 与特征值的关系:特征值之 等于方阵的 行列式

6.2 相似矩阵

相似矩阵 :设 \(\boldsymbol A,\boldsymbol B\) 都是 \(n\) 阶方阵(矩阵),若存在 可逆 矩阵 \(\boldsymbol P\),使得 \(\boldsymbol{AP} = \boldsymbol{PB}\),即 \(\boldsymbol P^{-1} \boldsymbol A \boldsymbol P = \boldsymbol B\),则称 \(\boldsymbol B\) 是 \(\boldsymbol A\) 的 相似矩阵 ,或 \(\boldsymbol A\) 与 \(\boldsymbol B\) 相似。

相似变换 :对 \(\boldsymbol A\) 进行运算 \(\boldsymbol P^{-1} \boldsymbol A \boldsymbol P\) 称为对 \(\boldsymbol A\) 进行 相似变换

相似变换矩阵可逆 矩阵 \(\boldsymbol P\) 称为把 \(\boldsymbol A\) 变成 \(\boldsymbol B\) 的 相似变换矩阵

矩阵相似的 运算性质 : 满足 反身性对称性传递性

总结:矩阵的等价向量的等价矩阵的相似 都满足 反身性对称性传递性
注意:满秩矩阵(降秩矩阵)行列式 、几类 特殊矩阵逆矩阵特征值与特征向量相似矩阵 这些都是单独针对于 方阵 的,矩阵不存在。

相似矩阵的 性质

  • 相似矩阵的 特征多项式 相同,从而其 特征值 相同。推论:若某方阵与 对角矩阵 相似,则对角矩阵主对角线上的 \(n\) 个元素即该方阵的特征值。
  • 相似矩阵的 行列式 相同。
  • 相似矩阵的 转置矩阵 相似。
  • 相似矩阵的 幂矩阵 相似。
  • 若互为相似的两个矩阵中 其中一个矩阵可逆 ,则 另一个矩阵可逆 ,且两个矩阵的 可逆矩阵 相似。(可由行列式相同推得)

注:对于涉及矩阵(方阵)的 幂的运算 ,可以考虑 将其展开 ,然后判断 相邻两项是否可以通过逆矩阵进行化简 / 合并


矩阵的 相似对角化 :寻找 相似变换矩阵 \(\boldsymbol P\),从而找到与原矩阵(方阵)相似的对角矩阵 ,就是 矩阵的相似对角化 ,简称 矩阵的对角化

矩阵 能够对角化充要条件 :\(n\) 阶矩阵(方阵)能对角化的充要条件是矩阵有 \(n\) 个 线性无关的特征向量 。推论:如果矩阵的 \(n\) 个 特征值 互不相等,则矩阵能够对角化。

6.3 实对称矩阵的对角化

实对称矩阵的 定义 :特征值都是 实数 的对称矩阵称为 实对称矩阵

实对称矩阵的 性质

  • 实对称矩阵的 互异 的特征值所对应的特征向量是 正交的
  • 设 \(\boldsymbol A\) 为 \(n\) 阶实对称矩阵,\(\lambda\) 是 \(\boldsymbol A\) 的特征方程的 \(r\) 重根 ,则矩阵 \(\boldsymbol A - \lambda \boldsymbol E\) 的 \(R(\boldsymbol A - \lambda \boldsymbol E) = n-r\),从而对应于特征值 \(r\) 恰有 \(r\) 个 线性无关的特征向量
  • 实对称矩阵 一定能对角化

实对称矩阵对角化的 步骤

  1. 求实对称矩阵的 特征值
  2. 解方程 \((\boldsymbol A - \lambda_i \boldsymbol E) \boldsymbol x = \boldsymbol 0\),求出 \(\boldsymbol A\) 对应于 \(\lambda_i\) 的 特征向量
  3. 将特征向量 正交化单位化
  4. 写出 正交矩阵(相似变换矩阵 \(\boldsymbol P\)) 及与 \(\boldsymbol A\) 相似的 对角矩阵

注:若矩阵 \(\boldsymbol A\) 能对角化,则其 特征多项式 \(f(\boldsymbol A) = 0\)。

相关推荐
好奇龙猫6 分钟前
【人工智能学习-AI-MIT公开课-第9.约束:视觉对象识别(視覚対象認識)】
学习
nvd118 分钟前
FastMCP 开发指南: 5分钟入门
人工智能·python
wp123_127 分钟前
反激应用1:1贴片耦合电感选择:Coilcraft LPD3015-473MR vs 国产兼容 TONEVEE CDD3015-473M
人工智能·制造
不错就是对27 分钟前
【agent-lightning】 - 2_使用 Agent-lightning 训练第一个智能体
人工智能·深度学习·神经网络·自然语言处理·chatgpt·transformer·vllm
zhengfei61130 分钟前
AI渗透工具—Shannon完全自主的AI渗透测试工具
人工智能·深度学习·web安全·知识图谱·测试覆盖率·安全性测试·威胁分析
愚公搬代码32 分钟前
【愚公系列】《AI+直播营销》004-重视直播营销,打造直播竞争力(直播活动的基本原理)
人工智能
哥本哈士奇38 分钟前
简单的神经网络计算过程 - 正负判断
人工智能·深度学习·神经网络
自动驾驶小学生43 分钟前
Transformer和LLM前沿内容(3):LLM Post-Training
人工智能·深度学习·transformer
程序猿零零漆1 小时前
Spring之旅 - 记录学习 Spring 框架的过程和经验(八)基于Spring的注解应用
java·学习·spring
imbackneverdie1 小时前
从零到一,如何用AI高效构建国自然申请书初稿?
人工智能·自然语言处理·aigc·科研·ai写作·学术·国家自然科学基金