线代的几何意义(一)——向量,坐标,矩阵

这个系列的文章本质上是3Blue1Brown视屏的观后总结,如果想看视屏的朋友们可以点击链接直达b站的视频。

前面关于矩阵的文章都是从矩阵的数字意义上分析的,很少引入更为直观(可以这样说吧)的从几何出发的解释。而这个系列的文章变旨在通过几何角度的解释帮助你进一步了解线性代数。

向量

线性代数中最基本的元素是向量。那么向量是什么呢?你一般可以想到两种描述向量的方式------一组数,或者是一个有方向的箭头。在这个系列的文章里由于我们研究的是线代的几何解释,那么大部分时间里当提到向量时,希望你脑海中首先浮现的是一个箭头,这会方便你后面的理解。

要注意的是,在有些领域中,向量的出发点并不固定。而在线代中,我们一般默认向量的出发点是原点,而只在极少的情况下会将向量的出发点从原点移出来,比如做向量加法时会让两个向量收尾相加。

坐标系&坐标

要想在空间中描述向量,我们首先需要的是一个坐标系。要描述一个坐标系,我们需要一组数量对应坐标系维度的不共线的基底,与一个原点。而在线性代数中,我们一般会固定一个原点,这似乎理所当然,然后便直接以一组基底代指一种坐标系。

而坐标则是由坐标系的导出的概念,是我们描述向量这个箭头的方式。但是,坐标并不单纯只是一个有序数对。坐标有意义的前提条件是有其对应的一组基底。我们平常默认的基底是 e i = ( 1 , 0 ) , e j = ( 0 , 1 ) e_i=(1,0),e_j=(0,1) ei=(1,0),ej=(0,1),而在线性代数中,会出现基底改变的情况。因此,要明白,一个坐标 ( 3 , 4 ) (3,4) (3,4)在不同的基底下,可能会表示两个不同的向量

矩阵?线性变换!

矩阵,究竟是什么东西呢?难道,就只是数学家进行了头脑风暴,想出来的一种把一堆数字用一种方法写到一起的一种结构吗?说实话,在了解矩阵的几何解释之前,我就真是这么认为的。目前接触的各种教学资料仅仅是把矩阵当成一种统合数字的工具来教授。但是,矩阵也有其具象的表示,那就是线性变换!

线性变换,一言以蔽之,就是对坐标系的变换。

如图,下面是最常见的一种坐标系:

x x x轴与 y y y轴互相垂直,单位基底是 i = ( 1 , 0 ) , j = ( 0 , 1 ) i=(1,0),j=(0,1) i=(1,0),j=(0,1)。

但如果我把 y y y轴从 x = 0 x=0 x=0改为 y = x y=x y=x,那么坐标系会变为下图的样子(蓝线和绿线):

由此,我们可以想象,原坐标系里的所有向量由于坐标系的改变,也应该会经历某种改变。如果是原坐标系中夹在 x x x半轴和 y y y半轴中的向量,那么坐标系变换后它们应该经历了某种被压缩的过程。

由于这是一篇文字组成的文章,原谅我无法为你展示具体动画,但是你可以在文章开头提供的视屏链接里看到所有线性代数的几何解释与动图式的介绍,相信你会更直观地感受到何谓线性变换。

如果在原坐标系里向量的坐标是 ( 3 , 2 ) (3,2) (3,2)(记住,这个坐标也是相对于其基底而言的)。考虑我们变换的是坐标系,那么变换后的向量在坐标系里整体的坐标应当不变,在结合到我们如何定义一个坐标系的过程,不难想到,坐标系的变换,本质上是基底的变换(线性变换会保证原点不变)。

也就是,上图描述的变换可以描述成:坐标系的基底变为了 i = ( 1 , 0 ) , j = ( 1 , 1 ) i=(1,0),j=(1,1) i=(1,0),j=(1,1),而其中的坐标保持不变,如 ( 3 , 2 ) (3,2) (3,2)在变换后的坐标系仍然是 ( 3 , 2 ) (3,2) (3,2)。即变换后的向量为 [ 3 × ( 1 , 0 ) , 2 × ( 1 , 1 ) ] [3\times (1,0), 2\times (1,1)] [3×(1,0),2×(1,1)]

于是,聪明的你,应当想到,我们可以"发明"一种方式用一个式子来描述这样的变换:

[ 1 1 0 1 ] [ 3 2 ] = [ 6 2 ] (1) \left[ \begin{matrix} 1 & 1\\ 0 & 1 \end{matrix} \right] \left[ \begin{matrix} 3 \\ 2 \end{matrix} \right] = \left[\begin{matrix} 6 \\ 2 \end{matrix} \right] \tag{1} [1011][32]=[62](1)

我们将基底 i = ( 1 , 0 ) i=(1,0) i=(1,0)放在矩阵的左边, j = ( 1 , 1 ) j=(1,1) j=(1,1)放到矩阵的右边,将其乘上坐标 ( 3 , 2 ) (3,2) (3,2),便得到了线性变换后的向量。这个过程,正好便是矩阵乘向量的过程。并非巧合,因为这就是向量的另一种理解------线性变换。


如此,对矩阵从全新的几何角度理解,希望会让你茅塞顿开。

相关推荐
云云3216 小时前
怎么通过亚矩阵云手机实现营销?
大数据·服务器·安全·智能手机·矩阵
姚先生977 小时前
LeetCode 54. 螺旋矩阵 (C++实现)
c++·leetcode·矩阵
云云3219 小时前
云手机方案全解析
大数据·服务器·安全·智能手机·矩阵
云云32110 小时前
云手机能用来干什么?云手机在跨境电商领域的用途
服务器·线性代数·安全·智能手机·矩阵
云云32110 小时前
云手机方案总结
服务器·线性代数·安全·智能手机·矩阵
gang_unerry11 小时前
量子退火与机器学习(1):少量数据求解未知QUBO矩阵,以少见多
人工智能·python·算法·机器学习·数学建模·矩阵·量子计算
AI小白白猫12 小时前
20241230 基础数学-线性代数-(1)求解特征值(numpy, scipy)
线性代数·numpy·scipy
SchrodingerSDOG14 小时前
(补)算法刷题Day24: BM61 矩阵最长递增路径
数据结构·python·算法·矩阵
古希腊掌管学习的神19 小时前
[搜广推]王树森推荐系统——矩阵补充&最近邻查找
python·算法·机器学习·矩阵
大山同学1 天前
第三章线性判别函数(二)
线性代数·算法·机器学习