线性代数 - 解空间
flyfish
例1:一维解空间(直线)
方程组(2个方程,2个未知数)
{x1−x2=02x1−2x2=0⇒A=[1−12−2],Ax=0 \begin{cases} x_1 - x_2 = 0 \\ 2x_1 - 2x_2 = 0 \end{cases} \quad \Rightarrow \quad A = \begin{bmatrix} 1 & -1 \\ 2 & -2 \end{bmatrix}, \quad A\mathbf{x}=\mathbf{0} {x1−x2=02x1−2x2=0⇒A=[12−1−2],Ax=0
行简化后得到 x1=x2x_1 = x_2x1=x2,令自由变量 x2=tx_2 = tx2=t,解为
x=[tt]=t[11],t∈R \mathbf{x} = \begin{bmatrix} t \\ t \end{bmatrix} = t \begin{bmatrix} 1 \\ 1 \end{bmatrix}, \quad t\in\mathbb{R} x=[tt]=t[11],t∈R
解空间 :
Null(A)=span{[11]} {\operatorname{Null}(A) = \operatorname{span}\left\{ \begin{bmatrix} 1 \\ 1 \end{bmatrix} \right\}} Null(A)=span{[11]}
几何意义:在 ℝ² 平面上是一条过原点的直线 y = x。
例2:二维解空间(平面)
方程组(2个方程,3个未知数)
{x1+x2+x3=02x1+2x2+2x3=0⇒x1+x2+x3=0 \begin{cases} x_1 + x_2 + x_3 = 0 \\ 2x_1 + 2x_2 + 2x_3 = 0 \end{cases} \quad \Rightarrow \quad x_1 + x_2 + x_3 = 0 {x1+x2+x3=02x1+2x2+2x3=0⇒x1+x2+x3=0
自由变量取 x2=s, x3=tx_2 = s,\ x_3 = tx2=s, x3=t,则 x1=−s−tx_1 = -s - tx1=−s−t,解为
方程组的解的形式
0. 向量形式
x=[x1x2x3]=[−s−tst]=s[−110]+t[−101]\boldsymbol{x} = \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} -s - t \\ s \\ t \end{bmatrix} = s\begin{bmatrix} -1 \\ 1 \\ 0 \end{bmatrix} + t\begin{bmatrix} -1 \\ 0 \\ 1 \end{bmatrix}x= x1x2x3 = −s−tst =s −110 +t −101
(后面调整为 s[10−1]+t[01−1]s\begin{bmatrix} 1 \\ 0 \\ -1 \end{bmatrix} + t\begin{bmatrix} 0 \\ 1 \\ -1 \end{bmatrix}s 10−1 +t 01−1 ,只是向量系数符号调整,不影响结果)
x=s[−110]+t[−101]=s[10−1]+t[01−1](s,t∈R) \mathbf{x} = s\begin{bmatrix} -1 \\ 1 \\ 0 \end{bmatrix} + t\begin{bmatrix} -1 \\ 0 \\ 1 \end{bmatrix} = s\begin{bmatrix} 1 \\ 0 \\ -1 \end{bmatrix} + t\begin{bmatrix} 0 \\ 1 \\ -1 \end{bmatrix} \quad (s,t \in \mathbb{R}) x=s −110 +t −101 =s 10−1 +t 01−1 (s,t∈R)
1. 分量形式(变量表达式)
直接用自由变量表示每个未知数:
{x1=−x2−x3x2=x2(任意取值)x3=x3(任意取值)\begin{cases} x_1 = -x_2 - x_3 \\ x_2 = x_2 \quad (\text{任意取值}) \\ x_3 = x_3 \quad (\text{任意取值}) \end{cases}⎩ ⎨ ⎧x1=−x2−x3x2=x2(任意取值)x3=x3(任意取值)
(这里x2、x3x_2、x_3x2、x3是"自由变量",可以取任意实数)
2. 坐标点形式(三维空间中的点)
把解表示为R3\mathbb{R}^3R3中的点,每个点的坐标由自由变量决定:
(x1,x2,x3)=(−x2−x3, x2, x3)(x_1, x_2, x_3) = (-x_2 - x_3,\ x_2,\ x_3)(x1,x2,x3)=(−x2−x3, x2, x3)
比如:
- 当x2=1,x3=0x_2=1, x_3=0x2=1,x3=0时,解是(−1,1,0)(-1, 1, 0)(−1,1,0);
- 当x2=0,x3=1x_2=0, x_3=1x2=0,x3=1时,解是(−1,0,1)(-1, 0, 1)(−1,0,1);
- 当x2=2,x3=3x_2=2, x_3=3x2=2,x3=3时,解是(−5,2,3)(-5, 2, 3)(−5,2,3)。
3. 参数方程形式(平面的参数表示)
用两个独立参数(比如a、ba、ba、b)表示平面上的所有点:
{x1=−a−bx2=ax3=b(a,b∈R)\begin{cases} x_1 = -a - b \\ x_2 = a \\ x_3 = b \end{cases} \quad (a,b \in \mathbb{R})⎩ ⎨ ⎧x1=−a−bx2=ax3=b(a,b∈R)
(这里a、ba、ba、b是任意实数,和之前的s、ts、ts、t是同一个意思,只是换了参数符号)
4. 几何方程形式(平面的一般式)
所有解都满足的约束条件,就是解空间对应的平面方程:
x1+x2+x3=0x_1 + x_2 + x_3 = 0x1+x2+x3=0
(三维空间中,一次方程对应平面,这就是解空间的"几何表达式")
解空间 :
Null(A)=span{[10−1],[01−1]} {\operatorname{Null}(A) = \operatorname{span}\left\{ \begin{bmatrix} 1 \\ 0 \\ -1 \end{bmatrix}, \begin{bmatrix} 0 \\ 1 \\ -1 \end{bmatrix} \right\}} Null(A)=span⎩ ⎨ ⎧ 10−1 , 01−1 ⎭ ⎬ ⎫
几何意义:在 ℝ³ 空间里是过原点的一个平面。
例3:非齐次的情况(对比看)
同例1的系数矩阵,但右边不是 0:
{x1−x2=32x1−2x2=6⇒x1−x2=3 \begin{cases} x_1 - x_2 = 3 \\ 2x_1 - 2x_2 = 6 \end{cases} \quad \Rightarrow \quad x_1 - x_2 = 3 {x1−x2=32x1−2x2=6⇒x1−x2=3
一个特解:x1=3,x2=0x_1 = 3, x_2 = 0x1=3,x2=0 → x0=[30]\mathbf{x}_0 = \begin{bmatrix} 3 \\ 0 \end{bmatrix}x0=[30]
对应的齐次解空间还是例1的:span{[11]}\operatorname{span}\{\begin{bmatrix} 1 \\ 1 \end{bmatrix}\}span{[11]}
所有解:
x=[30]+t[11]=[3+tt],t∈R \mathbf{x} = \begin{bmatrix} 3 \\ 0 \end{bmatrix} + t \begin{bmatrix} 1 \\ 1 \end{bmatrix} = \begin{bmatrix} 3+t \\ t \end{bmatrix}, \quad t\in\mathbb{R} x=[30]+t[11]=[3+tt],t∈R
几何意义:ℝ² 中一条平行于 y=x 但不过原点的直线(x-y=3)。
ℝ:表示全体实数 (real numbers),包括整数、小数、无理数、负数......比如 -3, 0, 2.7, √2, π 都属于 ℝ。
上标 2:表示二维 ,也就是每个元素都由两个实数 按顺序组成。所有由两个实数 有序排列组成的集合,也就是二维实数空间 。
所以 ℝ² 就是:
R2={(x,y)∣x∈R, y∈R} \mathbb{R}^2 = \{ (x, y) \mid x\in\mathbb{R},\ y\in\mathbb{R} \} R2={(x,y)∣x∈R, y∈R}
或者写成列向量的形式也一样:
R2={[xy]∣x,y∈R} \mathbb{R}^2 = \left\{ \begin{bmatrix} x \\ y \end{bmatrix} \mid x,y\in\mathbb{R} \right\} R2={[xy]∣x,y∈R}
| 记号 | 含义 | 几何形象 |
|---|---|---|
| ℝ¹ 或 ℝ | 一维实数空间 | 数轴 |
| ℝ² | 二维实数空间 | 平面 |
| ℝ³ | 三维实数空间 | 我们生活的立体空间 |
| ℝⁿ | n维实数空间 | 高维空间 |
| 元素 | 是否属于 ℝ²? | 说明 |
|---|---|---|
| (3, -5) | 是 | 两个实数 |
| [10]\begin{bmatrix} 1 \\ 0 \end{bmatrix}[10] | 是 | 列向量形式,等价于 (1,0) |
| (1, 2, 3) | 不是 | 有三个数,属于 ℝ³ |
| (√2, π) | 是 | √2 和 π 都是实数 |
| (1+2i, 3) | 不是 | 出现了虚数 i,属于 ℂ²(复数平面) |
解空间 严格的说
设 A 是一个 m×n 的矩阵(m 个方程,n 个未知数)。
-
齐次线性方程组
Ax=0 A\mathbf{x} = \mathbf{0} Ax=0它的所有解 组成的集合叫做 A 的零空间 ,记作
Null(A)或ker(A) \operatorname{Null}(A) \quad \text{或} \quad \ker(A) Null(A)或ker(A)叫法:零空间(很多教材也直接叫"解空间",但严格来说只有齐次才叫解空间)。
Null(A) 一定是 ℝⁿ 的一个向量子空间(一定包含零向量,对加法和数乘封闭)。
- 非齐次线性方程组
Ax=b(b≠0) A\mathbf{x} = \mathbf{b} \quad (\mathbf{b} \neq \mathbf{0}) Ax=b(b=0)
它的所有解组成的集合不叫 解空间,而叫解集合 ,它是一个仿射子空间 :
如果 x0\mathbf{x}_0x0 是 Ax = b 的一个特解,则
所有解=x0+Null(A) \text{所有解} = \mathbf{x}_0 + \operatorname{Null}(A) 所有解=x0+Null(A)
(特解 + 齐次部分的全部解)
解空间 Null(A) 可以用 span 的形式写出来:
Null(A)=span{v1,v2,...,vk} \operatorname{Null}(A) = \operatorname{span}\{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_k\} Null(A)=span{v1,v2,...,vk}
其中 v1,...,vk\mathbf{v}_1,\dots,\mathbf{v}_kv1,...,vk 是一组基(线性无关且能生成整个解空间),k = 自由变量个数 = 解空间的维数。
初等行变换没改解空间
无论怎么做三类初等行变换(倍加、对换、倍乘非零),方程组的解集合完全不变,因此:
齐次方程的解空间 Null(A) 不变
非齐次方程的所有解集合也不变
- 右边全 0 → 齐次 → 解空间 = Null(A) = span{基向量}(是子空间)
- 右边有非 0 → 非齐次 → 所有解 = 特解 + Null(A)(是仿射空间)
- 解空间的基底个数 = 自由变量个数 = n - rank(A)
- 初等行变换不改变解集合
| 记号 | 全称 | 字面意思 |
|---|---|---|
| Null(A) | Null space of A | "null" = 零、无、空的。Ax = 0 的解就是让 Ax 结果为"零向量"的 x 的集合,所以叫"零空间"。(德语叫 Kern,英文就叫 Null space) |
| span{...} | Span of a set of vectors | "span" 本意是"跨度、跨越、生成范围"。就像两根柱子用横梁一撑,就能"跨越"出一大片区域;几个向量一组合,就能"跨越"出一大片空间,所以叫"张成"。 |
Null space → "让 Ax 等于 null(零向量)的空间" → 零空间
Span → "这些向量能撑起(span across)多大的地盘" → 张成空间