课程地址:https://git hub.com/datawhalechina/math-for-ai
目录
[2.7 线性映射](#2.7 线性映射)
[2.8 仿射空间](#2.8 仿射空间)
[练习 2.1](#练习 2.1)
2.7 线性映射
一、什么是线性映射?
简单来说,线性映射就是两个线性空间之间的一种保持线性结构 的映射。什么叫"保持线性结构"呢?就是加法 和数乘这两种运算在映射前后不会被破坏。
1. 正式定义(定义2.15)
一个映射 Φ: V → W 是线性的,当且仅当它满足以下两条:
-
可加性 :
Φ(x + y) = Φ(x) + Φ(y)
-
齐次性 :
Φ(λx) = λΦ(x)
这两条性质可以合并为一条:
Φ(λx + ψy) = λΦ(x) + ψΦ(y)
2. 举个栗子 🌰 (例2.19)
考虑映射 Φ: R² → C
,定义为 Φ([x₁, x₂]) = x₁ + i x₂
(将一个二维实数向量映射为一个复数)。
-
检查加法:
Φ([x₁,x₂] + [y₁,y₂]) = (x₁+y₁) + i(x₂+y₂) = (x₁+ix₂) + (y₁+iy₂) = Φ([x₁,x₂]) + Φ([y₁,y₂])
✅ -
检查数乘:
Φ(λ[x₁,x₂]) = λx₁ + iλx₂ = λ(x₁+ix₂) = λΦ([x₁,x₂])
✅所以,这是一个线性映射。这也解释了为什么复数可以看作是二维实数空间。
二、线性映射的"个性":单射、满射、双射
这些词描述的是映射的"覆盖范围"和"一对一"程度。我们可以用一个生动的例子来理解:
想象映射 Φ 是把观众(V
)安排到电影院座位(W
)的规则。
-
单射 (Injective) :"一人一座" 。不同的观众一定坐在不同的座位上。不可能有两个人坐在同一个位置。数学表达:如果
Φ(x) = Φ(y)
,那么必须有x = y
。 -
满射 (Surjective) :"座无虚席" 。每个座位都至少有一个观众坐着。数学表达:
Φ(V) = W
,即 W 中每个元素都被 V 中某个元素映射到。 -
双射 (Bijective) :"完美对号入座"。它既是单射又是满射。每个观众都有且只有一个座位,每个座位都有且只有一个观众。这是一一对应的关系。
特殊身份认证 🎖️
基于线性和双射,我们给一些特殊的线性映射颁发"头衔":
-
同构 (Isomorphism) :线性 且双射的映射。这意味着空间 V 和 W 在结构上"完全一样",只是元素的名字不同。
-
自同态 (Endomorphism) :从一个空间 V 映射到它自己 V 的线性映射。 (
Φ: V → V
) -
自同构 (Automorphism) :从一个空间 V 映射到它自己 V 的线性双射 映射。比如恒等映射
id_V: x ↦ x
。
重要定理(定理2.17)
两个有限维 的线性空间 V 和 W 是同构 的,当且仅当 dim(V) = dim(W)
。
- 通俗理解:维数相同,空间就同构。这就像说,所有3维的空间(比如所有三元实数组的空间、所有2x2对称矩阵的空间等)在结构上都是一样的。
三、线性映射的"身份证":矩阵表示
任何一个线性映射,只要我们在定义域和值域中选定了基,就可以用一个矩阵来唯一地表示它。
1. 坐标与坐标向量(定义2.18)
-
在一个线性空间 V 中,一旦我们选定一个有序基
B = (b₁, b₂, ..., bₙ)
,那么空间中的任何一个向量x
都可以唯一地表示为基向量的线性组合:x = α₁b₁ + α₂b₂ + ... + αₙbₙ
。 -
这组系数
(α₁, α₂, ..., αₙ)
就是向量x
在基 B 下的坐标 。把它们堆成一个列向量[α₁, α₂, ..., αₙ]ᵀ
,就是 坐标向量。
2. 变换矩阵(定义2.19)
-
现在,对于线性映射
Φ: V → W
,我们给 V 选基 B,给 W 选基 C。 -
关键思想:想知道 Φ 怎么映射,只需要看它把 V 的基向量
bⱼ
映射成了 W 中的什么向量。 -
我们把每个
Φ(bⱼ)
都用 W 的基 C 来表示:Φ(bⱼ) = α₁ⱼc₁ + α₂ⱼc₂ + ... + αₘⱼcₘ
。 -
然后,把这些坐标向量
[α₁ⱼ, α₂ⱼ, ..., αₘⱼ]ᵀ
并排排列,就得到了 Φ 关于基 B 和 C 的变换矩阵 A_Φ 。
A_Φ = [ [Φ(b₁)]_C, [Φ(b₂)]_C, ..., [Φ(bₙ)]_C ]
核心公式 💡
如果 x
在基 B 下的坐标向量是 x̂
,那么 Φ(x)
在基 C 下的坐标向量 ŷ
可以通过矩阵乘法得到:
ŷ = A_Φ x̂
这个公式非常强大!它将抽象的线性映射运算,转化为了具体的矩阵乘法运算。
四、换个角度看世界:基变换
同一个向量,在不同的坐标系(基)下,坐标表示是不同的。同一个线性映射,在不同的基下,其变换矩阵也不同。
基变换定理(定理2.20)
假设:
-
在 V 中,从旧基 B 变换到新基 B̃,变换矩阵是 S(它的每一列是新基向量在旧基下的坐标)。
-
在 W 中,从旧基 C 变换到新基 C̃,变换矩阵是 T。
-
A_Φ
是映射 Φ 关于旧基 B, C 的矩阵。 -
Ã_Φ
是映射 Φ 关于新基 B̃, C̃ 的矩阵。
那么,新旧变换矩阵之间的关系是:
Ã_Φ = T⁻¹ A_Φ S
理解 :要得到在新基下的变换矩阵,我们需要先"翻译"到旧基 (S
),然后执行旧基下的变换 (A_Φ
),最后再"翻译"回新基 (T⁻¹
)。
定义关联
-
等价矩阵 :如果
à = T⁻¹ A S
,则 A 和 Ã 是等价的。这描述的是同一个线性映射在不同基下的矩阵。 -
相似矩阵 :如果
à = S⁻¹ A S
(此时 V=W, B=C, B̃=C̃, T=S),则 A 和 Ã 是相似的。这描述的是同一个线性变换在同一个空间的不同基下的矩阵。相似是等价的一种特殊情况。
五、映射的"地盘"与"盲区":像与核
对于一个线性映射 Φ: V → W
,我们关心两个重要的子空间:
1. 核 (Kernel) / 零空间 (Null Space)
-
定义 :
ker(Φ) = { v ∈ V | Φ(v) = 0 }
-
是什么:所有被 Φ "压扁"成 W 中零向量的 V 中向量的集合。它是 V 的子空间。
-
几何意义:映射的"盲区"。从 V 中不同的点出发,如果它们的差在核里,它们会被映射到 W 中的同一个点。
2. 像 (Image) / 值域 (Range)
-
定义 :
Im(Φ) = { w ∈ W | ∃ v ∈ V, such that Φ(v) = w }
-
是什么:W 中所有能被 V 中某个向量映射到的点的集合。它是 W 的子空间。
-
与矩阵的关系 :如果 Φ 由矩阵 A 表示,那么
Im(Φ)
就是矩阵 A 的列空间(所有列向量张成的空间)。
3. 秩-零度定理 (The Fundamental Theorem)
这是一个非常优美而重要的定理:
dim(ker(Φ)) + dim(Im(Φ)) = dim(V)
-
核的维数 + 像的维数 = 定义域的维数
-
直观理解 :映射 Φ 把 V 这个空间,"压缩"掉了
dim(ker(Φ))
这么多个维度,剩下的dim(Im(Φ))
个维度就是像空间的维度。
推论 :
如果 dim(V) = dim(W)
,那么:
Φ 是单射 ⇔ Φ 是满射 ⇔ Φ 是双射
这三个性质在这种情况下是等价的!
本章核心思想总结
-
线性映射是"守规矩"的映射,它保持加法和数乘运算。
-
线性映射可以用矩阵 来表示,矩阵的具体形式依赖于所选的基。
-
基变换会引出差价矩阵和相似矩阵的概念,它们是理解同一映射/变换在不同视角下表现的关键。
-
像 和核 揭示了线性映射的结构信息,而秩-零度定理则精确描述了它们之间的关系。
2.8 仿射空间
一、什么是仿射空间?
核心思想 :仿射空间就是一个线性空间(向量空间)被"平移"了一下,它的原点不再固定在(0,0,...)了。
1. 正式定义(定义2.25)
设 V
是一个线性空间,x₀ ∈ V
是一个点(称为支点 ),U ⊆ V
是一个子空间(称为方向空间 )。那么集合
L = x₀ + U = { x₀ + u | u ∈ U }
就称为 V
的一个仿射子空间 或线性流形。
2. 关键理解 💡
-
x₀
(支点):决定了这个仿射空间"平移"到了哪里。就像确定了一条直线经过哪个点。 -
U
(方向空间):决定了这个仿射空间的"朝向"和"维度"。就像决定了一条直线的方向。 -
L
(仿射空间) :是所有从支点x₀
出发,沿着方向空间U
中任意方向移动所能到达的点的集合。
重要区别 :如果支点 x₀ ∉ U
(通常都不在,除非恰好选在原点),那么仿射子空间 L
不是 V
的线性子空间,因为它不包含零向量。
举个栗子 🌰 (例2.26 与 图2.13)
-
一条不经过原点的直线 :
y = x₀ + λb₁
,其中λ ∈ R
,U = span[b₁]
。x₀
是直线上的一个点,b₁
决定了直线的方向。 -
一个不经过原点的平面 :
y = x₀ + λ₁b₁ + λ₂b₂
,其中λ₁, λ₂ ∈ R
,U = span[b₁, b₂]
。x₀
是平面上的一个点,b₁, b₂
是平面上两个不共线的方向向量。 -
超平面 :在
Rⁿ
中,一个(n-1)
维的仿射子空间。在R²
中,超平面就是直线;在R³
中,超平面就是平面。
https://i.imgur.com/example-line.png (想象一条不经过原点的直线,向量 y
是这条直线上的一个点)
二、仿射空间的参数方程
对于一个 k
维的仿射空间 L = x₀ + U
,如果我们给方向空间 U
选一组基 (b₁, ..., bₖ)
,那么 L
中的每一个点 x
都可以唯一地 表示为:
x = x₀ + λ₁b₁ + ... + λₖbₖ
其中 λ₁, ..., λₖ ∈ R
称为参数。
这就是我们熟悉的参数方程! 它清楚地告诉我们如何通过一个基准点(支点)和一组方向向量来构造整个空间。
三、仿射空间与线性方程组
这是一个非常重要的联系,它把代数和几何紧密地结合在了一起。
重要结论 :
对于非齐次线性方程组 Aλ = x
(其中 A ∈ R^(m×n)
):
-
它的解集要么是空集 ,要么是
Rⁿ
中的一个仿射子空间 ,其维数为n - rk(A)
。 -
特别地,方程
λ₁b₁ + ... + λₙbₙ = x
(且(λ₁,...,λₙ) ≠ (0,...,0)
)的解集是Rⁿ
中的一个超平面。
反过来也成立 :
在 Rⁿ
中,每一个 k
维的仿射子空间,都可以表示为一个非齐次线性方程组 Ax = b
的解集,其中 rk(A) = n - k
。
对比记忆:
-
齐次方程组
Ax = 0
的解集是一个线性子空间 (也看作支点为0
的特殊仿射空间)。 -
非齐次方程组
Ax = b
(b≠0) 的解集是一个仿射子空间(平移了的线性子空间)。
四、仿射映射
既然有了仿射空间,我们自然要研究它们之间的映射。仿射映射就是线性映射的"平移版"。
1. 正式定义(定义2.26)
对于两个线性空间 V, W
,一个映射 ϕ: V → W
称为仿射映射 ,如果它可以写成:
ϕ(x) = a + Φ(x)
其中:
-
Φ: V → W
是一个线性映射。 -
a ∈ W
是一个固定的向量,称为位移向量。
2. 核心理解 💡
-
Φ
(线性部分):负责旋转、缩放、剪切等"线性变换"。 -
a
(位移部分):负责整体的平移。 -
ϕ
(仿射映射) = 先线性变换,再平移。
3. 重要性质
-
结构性 :每个仿射映射都可以唯一地分解为一个线性映射和一个位移的复合 (
ϕ = τ ∘ Φ
,其中τ
是平移映射)。 -
封闭性:两个仿射映射的复合仍然是仿射映射。
-
几何不变性:仿射映射能够保持许多几何性质,例如:
-
点的共线性(一条直线上的点映射后仍在一条直线上)。
-
平行性(平行的线映射后仍然平行)。
-
线段的比例(一条线段上三点之间的比例在映射后保持不变)。
-
维数(将一个仿射子空间映射为另一个同维数的仿射子空间)。
-
本章核心思想总结
-
仿射空间是平移后的线性空间 ,形式为
L = x₀ + U
,它更通用,不一定包含原点。 -
仿射空间与线性方程组解集 有着深刻的对应关系:非齐次方程组的解集构成仿射空间。
-
仿射映射
ϕ(x) = a + Φ(x)
是线性映射的推广,它在计算机图形学、机器视觉等领域有极其广泛的应用,因为它能描述包括平移在内的所有线性几何变换。
习题
练习 2.1
a. 证明 (R∖{−1},⋆)(R∖{−1},⋆) 是一个阿贝尔群
要证明 (R∖{−1},⋆)(R∖{−1},⋆) 是一个阿贝尔群,需要验证闭包、结合律、单位元、逆元以及交换律。
-
闭包:对于任意 a,b∈R∖{−1}a,b∈R∖{−1},有 a⋆b=ab+a+ba⋆b=ab+a+b。假设 a⋆b=−1a⋆b=−1,则 ab+a+b=−1ab+a+b=−1,即 ab+a+b+1=0ab+a+b+1=0,亦即 (a+1)(b+1)=0(a+1)(b+1)=0。这意味着 a=−1a=−1 或 b=−1b=−1,但与 a,b∈R∖{−1}a,b∈R∖{−1} 矛盾。因此 a⋆b≠−1a⋆b=−1,即 a⋆b∈R∖{−1}a⋆b∈R∖{−1},闭包成立。
-
结合律:对于任意 a,b,c∈R∖{−1}a,b,c∈R∖{−1},有
(a⋆b)⋆c=(ab+a+b)⋆c=(ab+a+b)c+(ab+a+b)+c=abc+ac+bc+ab+a+b+c,(a⋆b)⋆c=(ab+a+b)⋆c=(ab+a+b)c+(ab+a+b)+c=abc+ac+bc+ab+a+b+c,a⋆(b⋆c)=a⋆(bc+b+c)=a(bc+b+c)+a+(bc+b+c)=abc+ab+ac+a+bc+b+c.a⋆(b⋆c)=a⋆(bc+b+c)=a(bc+b+c)+a+(bc+b+c)=abc+ab+ac+a+bc+b+c.
两者相等,因此结合律成立。
-
单位元:存在元素 e=0e=0,使得对于任意 a∈R∖{−1}a∈R∖{−1},有
a⋆0=a⋅0+a+0=a,a⋆0=a⋅0+a+0=a,
且 0∈R∖{−1}0∈R∖{−1},因此单位元为 00。
-
逆元:对于任意 a∈R∖{−1}a∈R∖{−1},存在 b=−aa+1b=a+1−a,使得
a⋆b=a⋅−aa+1+a+−aa+1=−a2a+1+a(a+1)a+1+−aa+1=−a2+a2+a−aa+1=0.a⋆b=a⋅a+1−a+a+a+1−a=a+1−a2+a+1a(a+1)+a+1−a=a+1−a2+a2+a−a=0.
由于 a≠−1a=−1,分母 a+1≠0a+1=0,且 b≠−1b=−1(否则 −aa+1=−1a+1−a=−1 implies 0=−10=−1,矛盾),因此逆元存在。
-
交换律:对于任意 a,b∈R∖{−1}a,b∈R∖{−1},有
a⋆b=ab+a+b=ba+b+a=b⋆a,a⋆b=ab+a+b=ba+b+a=b⋆a,
因此交换律成立。
综上,(R∖{−1},⋆)(R∖{−1},⋆) 是一个阿贝尔群。
b. 在阿贝尔群 (R∖{−1},⋆)(R∖{−1},⋆) 中解方程 3⋆x⋆x=153⋆x⋆x=15
方程 3⋆x⋆x=153⋆x⋆x=15 由于结合律等价于 (3⋆x)⋆x=15(3⋆x)⋆x=15。
首先计算 3⋆x3⋆x:
3⋆x=3⋅x+3+x=4x+3.3⋆x=3⋅x+3+x=4x+3.
然后计算 (3⋆x)⋆x(3⋆x)⋆x:
(4x+3)⋆x=(4x+3)⋅x+(4x+3)+x=4x2+3x+4x+3+x=4x2+8x+3.(4x+3)⋆x=(4x+3)⋅x+(4x+3)+x=4x2+3x+4x+3+x=4x2+8x+3.
设其等于 15:
4x2+8x+3=15,4x2+8x+3=15,
即
4x2+8x−12=0,4x2+8x−12=0,
除以 4:
x2+2x−3=0.x2+2x−3=0.
解二次方程:
x=−2±4+122=−2±162=−2±42,x=2−2±4+12=2−2±16=2−2±4,
得 x=1x=1 或 x=−3x=−3。
验证:
-
当 x=1x=1 时,3⋆1=3⋅1+3+1=73⋆1=3⋅1+3+1=7,然后 7⋆1=7⋅1+7+1=157⋆1=7⋅1+7+1=15,满足方程。
-
当 x=−3x=−3 时,3⋆(−3)=3⋅(−3)+3+(−3)=−93⋆(−3)=3⋅(−3)+3+(−3)=−9,然后 −9⋆(−3)=(−9)⋅(−3)+(−9)+(−3)=27−9−3=15−9⋆(−3)=(−9)⋅(−3)+(−9)+(−3)=27−9−3=15,满足方程。
且 x=1x=1 和 x=−3x=−3 均属于 R∖{−1}R∖{−1},因此方程的解为 x=1x=1 或 x=−3x=−3。