线性代数的本质笔记

课程来自b站发现的《线性代数的本质》,可以帮助从直觉层面理解线性代数的一些基础概念,以及把一些看似不同的数学概念解释之后,发现其实有内在的关联。

这里只对部分内容做一个记录,完整内容请自行观看视频~

01-向量究竟是什么

数字在线性代数中起到的主要作用就是缩放向量

线性代数仅围绕向量的加法和数乘

线性代数可以:

  • 实现对空间的操纵
  • 解线性方程组

02-线性组合,张成的空间与基

  • 每当用数字描述向量时,它都依赖于我们正在使用的基。

  • 所有可以表示为给定向量线性组合的向量的集合,被称作给定向量张成的空间(span) (下图中a,b在实数范围内变化)
    - 多个向量的线性组合:可以理解为对多个向量进行缩放,最后相加

  • 线性相关:

    有多个向量的时候,可以移除其中一个而不减小张成的空间

  • 线性无关:当所有向量都给张成的空间增添了新的维度

由此,其实可以想明白下面这句话为什么要这么定义:

向量空间的一组基是张成该空间的一个线性无关向量集

03-矩阵与线性变换

  • "变换"其实与"函数"是类似的

  • 线性变换需要遵守的性质:

  1. 直线在变换后仍然保持为直线,不能有所弯曲
  2. 原点必须保持固定

举例:对于白->蓝线,还都是直线,原点也没有变,但就不是线性变换了,因为对于一个对角线而言,在变换后的空间里它不再是直线了。线性变换可以视作"保持网格线平行且等距分布"的变换

  • 如何用数值取描述线性变换?
    实际上相当于只要记录两个基向量 i i i和 j j j变换后的位置

    一个二维变换仅由四个数字就可以完全确定:变换后的 i i i和 j j j的坐标。比如说下图这个2*2的矩阵,如果用它来描述线性变换,第一列就表示变换后的i,第二列就表示变换后的j向量(基向量)。 或者说,变换矩阵的两列其实就是两个基变换之后的位置

    举一个具体的例子:
  • 矩阵与向量相乘,可以理解为,将线性变换作用于两个新的基向量。如下图,结果就是黄色向量。

04-矩阵长发与线性变换复合的联系

  • 矩阵乘法与线性变换复合的联系
  • 两个矩阵相乘的几何意义:对基连续做两次线性变换,注意是从右向左的方向

    这里举例,对于M1,可以知道 j ^ j^{\hat{}} j^移到了[-2,0]的位置,然后再进行M2额计算,可以得到复合矩阵的第二列(j第二次变换后的位置)

05-行列式

先看两个具体的例子:

对于这个矩阵,相当于由原来11的矩形,变成了23=6的矩形,所以可以说这个线性变换将这个面积变为了6倍。

而这种情况下,虽然对空间有挤压,但是面积并未发生变化。

这个线性变换改变面积的比例被称为这个变换的行列式(二维),如果一个二维线性变换的行列式为0,说明这个变换将空间压缩到了更小的维度上(直觉:围成的面积为0,即i与j重合了)。

那当行列式为负数的时候呢?

类似于翻转,改变了空间的定向(对于二维,即i和j左右关系变了),绝对值仍然表示改变的面积比例。

二维行列式中,主对角线和另一条对角线元素的几何含义?
a、d表示平行四边形的底和高,而b、c表示平行四边形在对角方向上拉伸或压缩了多少。

对于三维矩阵,行列式相当于i,j,k基形成的平行六面体的体积 的缩放比例。如果此时行列式为0,那么矩阵的列必然线性相关(举例:因为至少有两个基会共线,这样三个基退化成平面/直线/点的情况,围成的体积为0)。关于定向是否改变:如果从右手系变成了左手系,那么定向发生了改变,变换的行列式为负数。

怎么用一句话解释:

det(M1M2) = det(M1)det(M2)

06-逆矩阵、列空间、秩与零空间

相关具体计算方法:高斯消元法、行阶梯型

将解方程组与几何直观联系起来:
A表示一种线性变化,这个等式表示把向量x经过线性变换后,使得它与v重合。

当A的行列式不为0,此时空间并未被挤压为零面积的区域,此时有且仅有一个向量x经变换后与v重合,此时也会存在A的逆,用A逆乘以v向量即可求解,相当于逆向的变换;

当A的行列式为0时,空间就被挤压了,此时就不再有逆变换了,但仍可以有解。比如,假设A把x的空间压缩成了一条直线,如果v恰好在这条直线的方向上,那么此时解存在。

与秩的关系:秩代表变换后空间的维数

当变换的结果为一条直线时,即结果是1维的,我们称这个变换的秩为1;

如果变换后的某个向量落在2维平面上,称这个变换的秩为2.

所有可能的输出向量A*v构成的集合称为A的列空间

矩阵的列表示基向量变换后的位置,这些变换后的基向量张成的空间就是所有可能的变换结果。

列空间就是矩阵的列所张成的空间。更精确的说,秩就是列空间的维数。秩最大的情况就是与列数相等,成为满秩。

零空间:变换后落在原点的向量的集合,被称为矩阵的零空间或者核kernel

零向量一定会被包含在列空间中,因为线性变换必须保持原点不变。如果是一个满秩变换,唯一能在变换后落在原点的就是零向量本身;如果是一个非满秩矩阵,会将空间压缩到一个更低的维度上,即会有很多向量在变换后成为零向量。

对于线性方程组Ax = v, 如果说v是一个零向量,x就相当于零空间,即这个向量方程所有可能的解。

#06-附注 非仿真 不同维度空间之间的线性变换

满秩:列空间维度和输入空间的维度相等

下图中,列空间其实就是三维空间中的一个二维平面,输入空间的维数就是基向量的个数2

另一个例子如下:从三维空间到二维的变换

07-点积与对偶性

这一节解决两个问题:

  • 点积为什么和顺序无关
  • 为什么点积的运算过程,即对应坐标相乘并将结果相加,和投影有所联系 -> 对偶性(两种事物之间自然而又出乎意料的对应关系)

点积举例

对于两个维数相同的向量,我们可以这样来求得点积结果:

点积的几何解释

这里可以是w的投影长度v的长度,也可以反过来是v的投影长度 w的长度,这里其实体现了点积和顺序无关,为什么呢?

首先,如果v和w向量长度相同,可以利用对称性,如下图,其实是一个镜像的关系,所以变换顺序也没有影响

接着,如果将其中一个向量进行缩放,对称性被破坏了,但向量本身缩放的倍数,其实就恰好等于这个向量的投影所缩放的倍数。倍数关系作为一个常数可被提取出去的,所以顺序不会有影响。

对偶性

为什么n维向量的点积和矩阵向量乘法(投影计算)之间是有联系的?

多维空间到一维空间的线性变换。假设有一个二维向量, v = [ 43 ] T v = [4 3]^T v=[43]T,就需要一个1X2的变换矩阵把它投影到一维上,假设此时这个转换矩阵就是[1, -2], 相当于把i投影到了一维数轴的1上,把j投影到了一维数轴的-2上,那么最终v向量变换后的一维向量就是 -2

对于任一线性变换,输出为1维数轴时,空间中会存在唯一的向量v与之相关。应用变换和与向量v做点积是一样的。
一个向量的对偶是由它定义的线性变换
一个多维空间到一维空间的线性变换 的对偶是 多维空间中的某个特定向量

08-01 叉积的标准介绍

两个向量的叉积表示的是这两个向量围成的平行四边形的面积。如果v在w的右侧,此时面积值为正,而如果v在w的左侧,面积值为负(右手定则大拇指朝内为负/ 以基向量i和j的定向为基础)。也就是说,顺序对叉积会有影响。

如果不想去判断方向,只想进行数值计算,那么也可以用行列式来求值,见05-行列式

以上两种不算是严格的叉积。真正的叉积是通过两个三维向量生成一个新的三维向量。如下所示,垂直于平行四边形的会有两个向量,使用右手定则确定。

08-02 以线性变换的眼光看叉积

为什么两个向量的叉积要写成 i j k的形式呢?

为什么这里面积就是行列式,基向量可以作为矩阵元(第一列的元素是i.j.k)?

对偶性的思想: 对于一个(多维)空间到数轴的线性变换时,都和那个空间中的唯一一个向量对应。即:应用线性变换和与这个向量点乘等价。

数值上说,是因为这类线性变换可以用一个只有一行的矩阵描述(相当于一个1*n维度的变换矩阵),而它的每一列给出了变换后基向量的位置。(例子如下,i变换后到2,j变换后到1)

对于二维空间,如上一节中的有下图中的对偶关系。

对于三维空间, 类似的,我们的计划是:

  1. 定义一个从三维空间到数轴的特定线性变换,且这个变换是根据向量v和w来定的。
  2. 找到这个变换的对偶向量
  3. 发现这个对偶向量就是v叉乘w

上面就是一个函数,这个3*3 矩阵可以理解为,第一列是一个任意可变向量,行列式的值就是由这三列的向量组成的平行六面体的体积。这个函数的重要性质是,它是线性的。由于它是线性的,就可以用矩阵乘法来描述这个函数,由于这个函数是从三维空间到一维空间,所以就会有一个1*3的变换矩阵;然后再利用对偶性,这个 1*3 的变换矩阵就可以立起来变成一个3*1的特定向量,并且可以将整个变换看作与这个特定向量(下图中的p向量)的点积。

  • 从数值计算的角度看:p的坐标值就是右侧括号里的三组结果

对于下图,把i,j,k放入矩阵第一列进行计算,得到的系数和前面的p的系数是相同的。在矩阵中插入i,j,k是为了提醒应该把这些系数解读为一个向量的坐标。

什么样的向量p,可以满足如下性质,使得它与向量x的点乘可以等于由向量x,v,w组成的平行六面体的有向体积?

  • 从几何角度,右边的行列式可以理解为以vw构成的平行四边形为底,向量x在垂直v和w方向上的分量作为高的体积值。而对于左侧,引申一下点乘的投影含义,向量p必然与v和w垂直,并且长度和这两个向量张成的平行四边形的面积相同。

09 基变换

对于空间中的同一个向量,如果选取的基向量不同,那么我们用于表示的数值就会不同。

对于基向量的转换,会有点别扭:蓝色是当前的坐标系下的向量,如果要把这个向量用其他系表示,那么前面的矩阵的是 "从当前基到其他系的基的变换"的逆矩阵

反之,

如何转化一个矩阵:最右的向量是用Jenifer的语言描述的,将她的向量转换到我们的系下后(基变换矩阵),再旋转90度,再转回Jenifer的系。这样得到的就是她的坐标系下,向左旋转90度后的结果。而不能直接用她的坐标乘以表示90度旋转的矩阵。

引申一下, A − 1 M A A^{-1}MA A−1MA这种形式都暗含一种数学上的转移作用,中间矩阵代表所见的变换,外侧表示视角的转换,最后表示的就是从其他视角看到的变换结果。

10 特征向量与特征值

如果对空间中的基向量做线性变换,在这个空间中如果有某个变量只进行了原方向上的缩放,那么这个向量就是特征向量,而这个特定方向上缩放的倍数就是特征值。

下图中,绿色是变换成原来3倍的i向量,大红色是变换后的j向量。绿线和黄线是变换后方向不变的向量,即特征向量,每个特征向量所缩放的倍数就是特征值。

假设有一个特征值为-0.5的特征向量,那么就意味着这个向量被反向且被压缩为原来的一半

变换后:重点在于仍在张成的直线上,没有旋转

对于一个三维空间内的旋转,如果可以找到这个旋转的特征向量,也就是留在它张成的空间里的向量,那么它其实就是旋转轴。把一个三维旋转看成绕某个轴旋转一定角度,比考虑相应的3*3矩阵更加直观。注意:这种情况下,旋转矩阵的特征值要为1,因为不会进行任何缩放。

求解特征值,其实就是去找非零解时,会导致降维的矩阵(A- λ \lambda λI),即det(A- λ \lambda λI) = 0.

二维线性变换不一定有特征向量,比如旋转90度,每个向量都旋转了且离开了其张成的空间。

  • 举例一,此时求出来特征值没有实数解,就代表没有特征向量。

  • 举例二,对于剪切变换:只有唯一的特征值,也只有在原来的i方向上的量可以一直不变

    不过注意:有可能出现只有一个特征值,但是特征向量不在一条直线上的情况,如下图,把基向量都扩大两倍,特征值是2,但每一个向量都是特征向量。

特征基

如果基向量恰好是特征向量,会发生什么?如下图的二维情况,此时的变换矩阵就会是一个对角阵,每一列就是基,对角元素就是对应的特征值。

好处:对于对角矩阵,如果要连续计算n次变换,其实也就是用对角元素的幂运算求解即可,不会很复杂。但是当一个矩阵不是对角时,可以变换成对角矩阵,然后求幂运算后再转化回原来的坐标系,计算上会更方便。

实际练习:

11 - 抽象向量空间

行列式和特征向量与所选坐标系无关

本节讨论函数和向量之间的若干联系。

函数与向量的对应关系:在相乘和相加上是类似的;对一个函数求导数,其实就相当于一种变换,算子和变换类似。

一个函数的线性变换是什么意思?线性要求可加性和成比例性。

为什么求导是线性运算,下图举例,求导运算可以满足可加性和成比例性。

一个线性变换可以通过它对基向量的作用来完全描述,这使得矩阵向量乘法成为可能。下面来用矩阵来描述求导。

对于空间中的无穷多个多项式进行求导,一个多项式其实就是一个线性组合的表示

基向量/基函数:x的不同次幂

相关推荐
Selina K30 分钟前
shell脚本知识点记录
笔记·shell
42 分钟前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习
霍格沃兹测试开发学社测试人社区1 小时前
软件测试学习笔记丨Flask操作数据库-数据库和表的管理
软件测试·笔记·测试开发·学习·flask
幸运超级加倍~2 小时前
软件设计师-上午题-16 算法(4-5分)
笔记·算法
MarkHD2 小时前
第十一天 线性代数基础
线性代数·决策树·机器学习
王俊山IT2 小时前
C++学习笔记----10、模块、头文件及各种主题(一)---- 模块(5)
开发语言·c++·笔记·学习
Yawesh_best3 小时前
思源笔记轻松连接本地Ollama大语言模型,开启AI写作新体验!
笔记·语言模型·ai写作
CXDNW5 小时前
【网络面试篇】HTTP(2)(笔记)——http、https、http1.1、http2.0
网络·笔记·http·面试·https·http2.0
使者大牙5 小时前
【大语言模型学习笔记】第一篇:LLM大规模语言模型介绍
笔记·学习·语言模型
ssf-yasuo5 小时前
SPIRE: Semantic Prompt-Driven Image Restoration 论文阅读笔记
论文阅读·笔记·prompt