Datawhale人工智能的数学基础 202510第3次作业

课程地址:https://git hub.com/datawhalechina/math-for-ai

目录

[2.7 线性映射](#2.7 线性映射)

一、什么是线性映射?

二、线性映射的"个性":单射、满射、双射

三、线性映射的"身份证":矩阵表示

四、换个角度看世界:基变换

五、映射的"地盘"与"盲区":像与核

本章核心思想总结

[2.8 仿射空间](#2.8 仿射空间)

一、什么是仿射空间?

二、仿射空间的参数方程

三、仿射空间与线性方程组

四、仿射映射

本章核心思想总结

习题

[练习 2.1](#练习 2.1)


2.7 线性映射

一、什么是线性映射?

简单来说,线性映射就是两个线性空间之间的一种保持线性结构 的映射。什么叫"保持线性结构"呢?就是加法数乘这两种运算在映射前后不会被破坏。

1. 正式定义(定义2.15)

一个映射 Φ: V → W 是线性的,当且仅当它满足以下两条:

  1. 可加性Φ(x + y) = Φ(x) + Φ(y)

  2. 齐次性Φ(λx) = λΦ(x)

这两条性质可以合并为一条:
Φ(λx + ψy) = λΦ(x) + ψΦ(y)

2. 举个栗子 🌰 (例2.19)

考虑映射 Φ: R² → C,定义为 Φ([x₁, x₂]) = x₁ + i x₂(将一个二维实数向量映射为一个复数)。

  • 检查加法:Φ([x₁,x₂] + [y₁,y₂]) = (x₁+y₁) + i(x₂+y₂) = (x₁+ix₂) + (y₁+iy₂) = Φ([x₁,x₂]) + Φ([y₁,y₂])

  • 检查数乘:Φ(λ[x₁,x₂]) = λx₁ + iλx₂ = λ(x₁+ix₂) = λΦ([x₁,x₂])

    所以,这是一个线性映射。这也解释了为什么复数可以看作是二维实数空间。


二、线性映射的"个性":单射、满射、双射

这些词描述的是映射的"覆盖范围"和"一对一"程度。我们可以用一个生动的例子来理解:

想象映射 Φ 是把观众(V)安排到电影院座位(W)的规则。

  • 单射 (Injective)"一人一座" 。不同的观众一定坐在不同的座位上。不可能有两个人坐在同一个位置。数学表达:如果 Φ(x) = Φ(y),那么必须有 x = y

  • 满射 (Surjective)"座无虚席" 。每个座位都至少有一个观众坐着。数学表达:Φ(V) = W,即 W 中每个元素都被 V 中某个元素映射到。

  • 双射 (Bijective)"完美对号入座"。它既是单射又是满射。每个观众都有且只有一个座位,每个座位都有且只有一个观众。这是一一对应的关系。

特殊身份认证 🎖️

基于线性和双射,我们给一些特殊的线性映射颁发"头衔":

  • 同构 (Isomorphism)线性双射的映射。这意味着空间 V 和 W 在结构上"完全一样",只是元素的名字不同。

  • 自同态 (Endomorphism) :从一个空间 V 映射到它自己 V 的线性映射。 (Φ: V → V)

  • 自同构 (Automorphism) :从一个空间 V 映射到它自己 V线性双射 映射。比如恒等映射 id_V: x ↦ x

重要定理(定理2.17)

两个有限维 的线性空间 V 和 W 是同构 的,当且仅当 dim(V) = dim(W)

  • 通俗理解:维数相同,空间就同构。这就像说,所有3维的空间(比如所有三元实数组的空间、所有2x2对称矩阵的空间等)在结构上都是一样的。

三、线性映射的"身份证":矩阵表示

任何一个线性映射,只要我们在定义域和值域中选定了基,就可以用一个矩阵来唯一地表示它。

1. 坐标与坐标向量(定义2.18)

  • 在一个线性空间 V 中,一旦我们选定一个有序基 B = (b₁, b₂, ..., bₙ),那么空间中的任何一个向量 x 都可以唯一地表示为基向量的线性组合:x = α₁b₁ + α₂b₂ + ... + αₙbₙ

  • 这组系数 (α₁, α₂, ..., αₙ) 就是向量 x 在基 B 下的坐标 。把它们堆成一个列向量 [α₁, α₂, ..., αₙ]ᵀ,就是 坐标向量

2. 变换矩阵(定义2.19)

  • 现在,对于线性映射 Φ: V → W,我们给 V 选基 B,给 W 选基 C。

  • 关键思想:想知道 Φ 怎么映射,只需要看它把 V 的基向量 bⱼ 映射成了 W 中的什么向量。

  • 我们把每个 Φ(bⱼ) 都用 W 的基 C 来表示:Φ(bⱼ) = α₁ⱼc₁ + α₂ⱼc₂ + ... + αₘⱼcₘ

  • 然后,把这些坐标向量 [α₁ⱼ, α₂ⱼ, ..., αₘⱼ]ᵀ 并排排列,就得到了 Φ 关于基 B 和 C 的变换矩阵 A_Φ
    A_Φ = [ [Φ(b₁)]_C, [Φ(b₂)]_C, ..., [Φ(bₙ)]_C ]

核心公式 💡

如果 x 在基 B 下的坐标向量是 ,那么 Φ(x) 在基 C 下的坐标向量 ŷ 可以通过矩阵乘法得到:
ŷ = A_Φ x̂

这个公式非常强大!它将抽象的线性映射运算,转化为了具体的矩阵乘法运算。


四、换个角度看世界:基变换

同一个向量,在不同的坐标系(基)下,坐标表示是不同的。同一个线性映射,在不同的基下,其变换矩阵也不同。

基变换定理(定理2.20)

假设:

  • 在 V 中,从旧基 B 变换到新基 B̃,变换矩阵是 S(它的每一列是新基向量在旧基下的坐标)。

  • 在 W 中,从旧基 C 变换到新基 C̃,变换矩阵是 T

  • A_Φ 是映射 Φ 关于旧基 B, C 的矩阵。

  • Ã_Φ 是映射 Φ 关于新基 B̃, C̃ 的矩阵。

那么,新旧变换矩阵之间的关系是:
Ã_Φ = T⁻¹ A_Φ S

理解 :要得到在新基下的变换矩阵,我们需要先"翻译"到旧基 (S),然后执行旧基下的变换 (A_Φ),最后再"翻译"回新基 (T⁻¹)。

定义关联

  • 等价矩阵 :如果 Ã = T⁻¹ A S,则 A 和 Ã 是等价的。这描述的是同一个线性映射在不同基下的矩阵。

  • 相似矩阵 :如果 Ã = S⁻¹ A S (此时 V=W, B=C, B̃=C̃, T=S),则 A 和 Ã 是相似的。这描述的是同一个线性变换在同一个空间的不同基下的矩阵。相似是等价的一种特殊情况。


五、映射的"地盘"与"盲区":像与核

对于一个线性映射 Φ: V → W,我们关心两个重要的子空间:

1. 核 (Kernel) / 零空间 (Null Space)

  • 定义ker(Φ) = { v ∈ V | Φ(v) = 0 }

  • 是什么:所有被 Φ "压扁"成 W 中零向量的 V 中向量的集合。它是 V 的子空间。

  • 几何意义:映射的"盲区"。从 V 中不同的点出发,如果它们的差在核里,它们会被映射到 W 中的同一个点。

2. 像 (Image) / 值域 (Range)

  • 定义Im(Φ) = { w ∈ W | ∃ v ∈ V, such that Φ(v) = w }

  • 是什么:W 中所有能被 V 中某个向量映射到的点的集合。它是 W 的子空间。

  • 与矩阵的关系 :如果 Φ 由矩阵 A 表示,那么 Im(Φ) 就是矩阵 A 的列空间(所有列向量张成的空间)。

3. 秩-零度定理 (The Fundamental Theorem)

这是一个非常优美而重要的定理:
dim(ker(Φ)) + dim(Im(Φ)) = dim(V)

  • 核的维数 + 像的维数 = 定义域的维数

  • 直观理解 :映射 Φ 把 V 这个空间,"压缩"掉了 dim(ker(Φ)) 这么多个维度,剩下的 dim(Im(Φ)) 个维度就是像空间的维度。

推论

如果 dim(V) = dim(W),那么:
Φ 是单射 ⇔ Φ 是满射 ⇔ Φ 是双射

这三个性质在这种情况下是等价的!


本章核心思想总结

  1. 线性映射是"守规矩"的映射,它保持加法和数乘运算。

  2. 线性映射可以用矩阵 来表示,矩阵的具体形式依赖于所选的

  3. 基变换会引出差价矩阵和相似矩阵的概念,它们是理解同一映射/变换在不同视角下表现的关键。

  4. 揭示了线性映射的结构信息,而秩-零度定理则精确描述了它们之间的关系。

2.8 仿射空间

一、什么是仿射空间?

核心思想 :仿射空间就是一个线性空间(向量空间)被"平移"了一下,它的原点不再固定在(0,0,...)了。

1. 正式定义(定义2.25)

V 是一个线性空间,x₀ ∈ V 是一个点(称为支点 ),U ⊆ V 是一个子空间(称为方向空间 )。那么集合
L = x₀ + U = { x₀ + u | u ∈ U }

就称为 V 的一个仿射子空间线性流形

2. 关键理解 💡

  • x₀ (支点):决定了这个仿射空间"平移"到了哪里。就像确定了一条直线经过哪个点。

  • U (方向空间):决定了这个仿射空间的"朝向"和"维度"。就像决定了一条直线的方向。

  • L (仿射空间) :是所有从支点 x₀ 出发,沿着方向空间 U 中任意方向移动所能到达的点的集合。

重要区别 :如果支点 x₀ ∉ U(通常都不在,除非恰好选在原点),那么仿射子空间 L 不是 V 的线性子空间,因为它不包含零向量。

举个栗子 🌰 (例2.26 与 图2.13)

  • 一条不经过原点的直线y = x₀ + λb₁,其中 λ ∈ RU = span[b₁]x₀ 是直线上的一个点,b₁ 决定了直线的方向。

  • 一个不经过原点的平面y = x₀ + λ₁b₁ + λ₂b₂,其中 λ₁, λ₂ ∈ RU = span[b₁, b₂]x₀ 是平面上的一个点,b₁, b₂ 是平面上两个不共线的方向向量。

  • 超平面 :在 Rⁿ 中,一个 (n-1) 维的仿射子空间。在 中,超平面就是直线;在 中,超平面就是平面。

https://i.imgur.com/example-line.png (想象一条不经过原点的直线,向量 y 是这条直线上的一个点)


二、仿射空间的参数方程

对于一个 k 维的仿射空间 L = x₀ + U,如果我们给方向空间 U 选一组基 (b₁, ..., bₖ),那么 L 中的每一个点 x 都可以唯一地 表示为:
x = x₀ + λ₁b₁ + ... + λₖbₖ

其中 λ₁, ..., λₖ ∈ R 称为参数

这就是我们熟悉的参数方程! 它清楚地告诉我们如何通过一个基准点(支点)和一组方向向量来构造整个空间。


三、仿射空间与线性方程组

这是一个非常重要的联系,它把代数和几何紧密地结合在了一起。

重要结论

对于非齐次线性方程组 Aλ = x(其中 A ∈ R^(m×n)):

  • 它的解集要么是空集 ,要么是 Rⁿ 中的一个仿射子空间 ,其维数为 n - rk(A)

  • 特别地,方程 λ₁b₁ + ... + λₙbₙ = x(且 (λ₁,...,λₙ) ≠ (0,...,0))的解集是 Rⁿ 中的一个超平面

反过来也成立

Rⁿ 中,每一个 k 维的仿射子空间,都可以表示为一个非齐次线性方程组 Ax = b 的解集,其中 rk(A) = n - k

对比记忆

  • 齐次方程组 Ax = 0 的解集是一个线性子空间 (也看作支点为 0 的特殊仿射空间)。

  • 非齐次方程组 Ax = b (b≠0) 的解集是一个仿射子空间(平移了的线性子空间)。


四、仿射映射

既然有了仿射空间,我们自然要研究它们之间的映射。仿射映射就是线性映射的"平移版"。

1. 正式定义(定义2.26)

对于两个线性空间 V, W,一个映射 ϕ: V → W 称为仿射映射 ,如果它可以写成:
ϕ(x) = a + Φ(x)

其中:

  • Φ: V → W 是一个线性映射

  • a ∈ W 是一个固定的向量,称为位移向量

2. 核心理解 💡

  • Φ (线性部分):负责旋转、缩放、剪切等"线性变换"。

  • a (位移部分):负责整体的平移。

  • ϕ (仿射映射) = 先线性变换,再平移

3. 重要性质

  • 结构性 :每个仿射映射都可以唯一地分解为一个线性映射和一个位移的复合 (ϕ = τ ∘ Φ,其中 τ 是平移映射)。

  • 封闭性:两个仿射映射的复合仍然是仿射映射。

  • 几何不变性:仿射映射能够保持许多几何性质,例如:

    • 点的共线性(一条直线上的点映射后仍在一条直线上)。

    • 平行性(平行的线映射后仍然平行)。

    • 线段的比例(一条线段上三点之间的比例在映射后保持不变)。

    • 维数(将一个仿射子空间映射为另一个同维数的仿射子空间)。


本章核心思想总结

  1. 仿射空间是平移后的线性空间 ,形式为 L = x₀ + U,它更通用,不一定包含原点。

  2. 仿射空间与线性方程组解集 有着深刻的对应关系:非齐次方程组的解集构成仿射空间。

  3. 仿射映射 ϕ(x) = a + Φ(x) 是线性映射的推广,它在计算机图形学、机器视觉等领域有极其广泛的应用,因为它能描述包括平移在内的所有线性几何变换。

习题

练习 2.1

a. 证明 (R∖{−1},⋆)(R∖{−1},⋆) 是一个阿贝尔群

要证明 (R∖{−1},⋆)(R∖{−1},⋆) 是一个阿贝尔群,需要验证闭包、结合律、单位元、逆元以及交换律。

  • 闭包:对于任意 a,b∈R∖{−1}a,b∈R∖{−1},有 a⋆b=ab+a+ba⋆b=ab+a+b。假设 a⋆b=−1a⋆b=−1,则 ab+a+b=−1ab+a+b=−1,即 ab+a+b+1=0ab+a+b+1=0,亦即 (a+1)(b+1)=0(a+1)(b+1)=0。这意味着 a=−1a=−1 或 b=−1b=−1,但与 a,b∈R∖{−1}a,b∈R∖{−1} 矛盾。因此 a⋆b≠−1a⋆b=−1,即 a⋆b∈R∖{−1}a⋆b∈R∖{−1},闭包成立。

  • 结合律:对于任意 a,b,c∈R∖{−1}a,b,c∈R∖{−1},有

    (a⋆b)⋆c=(ab+a+b)⋆c=(ab+a+b)c+(ab+a+b)+c=abc+ac+bc+ab+a+b+c,(a⋆b)⋆c=(ab+a+b)⋆c=(ab+a+b)c+(ab+a+b)+c=abc+ac+bc+ab+a+b+c,a⋆(b⋆c)=a⋆(bc+b+c)=a(bc+b+c)+a+(bc+b+c)=abc+ab+ac+a+bc+b+c.a⋆(b⋆c)=a⋆(bc+b+c)=a(bc+b+c)+a+(bc+b+c)=abc+ab+ac+a+bc+b+c.

    两者相等,因此结合律成立。

  • 单位元:存在元素 e=0e=0,使得对于任意 a∈R∖{−1}a∈R∖{−1},有

    a⋆0=a⋅0+a+0=a,a⋆0=a⋅0+a+0=a,

    且 0∈R∖{−1}0∈R∖{−1},因此单位元为 00。

  • 逆元:对于任意 a∈R∖{−1}a∈R∖{−1},存在 b=−aa+1b=a+1−a​,使得

    a⋆b=a⋅−aa+1+a+−aa+1=−a2a+1+a(a+1)a+1+−aa+1=−a2+a2+a−aa+1=0.a⋆b=a⋅a+1−a+a+a+1−a=a+1−a2+a+1a(a+1)+a+1−a=a+1−a2+a2+a−a=0.

    由于 a≠−1a=−1,分母 a+1≠0a+1=0,且 b≠−1b=−1(否则 −aa+1=−1a+1−a​=−1 implies 0=−10=−1,矛盾),因此逆元存在。

  • 交换律:对于任意 a,b∈R∖{−1}a,b∈R∖{−1},有

    a⋆b=ab+a+b=ba+b+a=b⋆a,a⋆b=ab+a+b=ba+b+a=b⋆a,

    因此交换律成立。

综上,(R∖{−1},⋆)(R∖{−1},⋆) 是一个阿贝尔群。

b. 在阿贝尔群 (R∖{−1},⋆)(R∖{−1},⋆) 中解方程 3⋆x⋆x=153⋆x⋆x=15

方程 3⋆x⋆x=153⋆x⋆x=15 由于结合律等价于 (3⋆x)⋆x=15(3⋆x)⋆x=15。

首先计算 3⋆x3⋆x:

3⋆x=3⋅x+3+x=4x+3.3⋆x=3⋅x+3+x=4x+3.

然后计算 (3⋆x)⋆x(3⋆x)⋆x:

(4x+3)⋆x=(4x+3)⋅x+(4x+3)+x=4x2+3x+4x+3+x=4x2+8x+3.(4x+3)⋆x=(4x+3)⋅x+(4x+3)+x=4x2+3x+4x+3+x=4x2+8x+3.

设其等于 15:

4x2+8x+3=15,4x2+8x+3=15,

4x2+8x−12=0,4x2+8x−12=0,

除以 4:

x2+2x−3=0.x2+2x−3=0.

解二次方程:

x=−2±4+122=−2±162=−2±42,x=2−2±4+12​​=2−2±16​​=2−2±4​,

得 x=1x=1 或 x=−3x=−3。

验证:

  • 当 x=1x=1 时,3⋆1=3⋅1+3+1=73⋆1=3⋅1+3+1=7,然后 7⋆1=7⋅1+7+1=157⋆1=7⋅1+7+1=15,满足方程。

  • 当 x=−3x=−3 时,3⋆(−3)=3⋅(−3)+3+(−3)=−93⋆(−3)=3⋅(−3)+3+(−3)=−9,然后 −9⋆(−3)=(−9)⋅(−3)+(−9)+(−3)=27−9−3=15−9⋆(−3)=(−9)⋅(−3)+(−9)+(−3)=27−9−3=15,满足方程。

且 x=1x=1 和 x=−3x=−3 均属于 R∖{−1}R∖{−1},因此方程的解为 x=1x=1 或 x=−3x=−3。

相关推荐
koo3643 小时前
李宏毅机器学习笔记27
人工智能·笔记·机器学习
文火冰糖的硅基工坊3 小时前
[人工智能-大模型-9]:大模型十大应用场景和对应的代表性的产品?
服务器·人工智能·大模型
木建隶3 小时前
AI 食用指南--更好的用AI编程
人工智能·ai编程
亚马逊云开发者3 小时前
GenDev 智能开发:Amazon Q Developer CLI 赋能Amazon Code Family实现代码审核
人工智能
CoovallyAIHub3 小时前
全球OCR新标杆!百度0.9B小模型斩获四项SOTA,读懂复杂文档像人一样自然
深度学习·算法·计算机视觉
weixin_377634843 小时前
【强化学习】RLMT强制 CoT提升训练效果
人工智能·算法·机器学习
Francek Chen3 小时前
【深度学习计算机视觉】14:实战Kaggle比赛:狗的品种识别(ImageNet Dogs)
人工智能·pytorch·深度学习·计算机视觉·kaggle·imagenet dogs
dxnb223 小时前
Datawhale25年10月组队学习:math for AI+Task3线性代数(下)
人工智能·学习·线性代数
拾光Ծ3 小时前
【C++高阶数据结构】红黑树
数据结构·算法