矩阵、线性代数

wewe_daisy2025-09-25 16:00

目录

[1. 向量](#1. 向量)

[2. 线性组合、张成的空间、基](#2. 线性组合、张成的空间、基)

[3. 矩阵与线性变换（将矩阵看作空间变换）](#3. 矩阵与线性变换（将矩阵看作空间变换）)

[4. 矩阵乘法与线性变换复合](#4. 矩阵乘法与线性变换复合)

三维空间的线性变换

[5. 行列式](#5. 行列式)

三维空间中：

计算行列式：

[6. 逆矩阵、列空间与零空间](#6. 逆矩阵、列空间与零空间)

秩、列空间、零空间

[7. 点积与对偶性](#7. 点积与对偶性)

[8.1 叉积的标准介绍](#8.1 叉积的标准介绍)

[8.2 以线性变换的目光看叉积（叉积所得向量的几何意义）](#8.2 以线性变换的目光看叉积（叉积所得向量的几何意义）)

[9. 基变换](#9. 基变换)

[10. 特征向量与特征值](#10. 特征向量与特征值)

[11. 抽象向量空间](#11. 抽象向量空间)

1. 向量

几何：向量是一个箭头，以xy坐标系上的原点为起点，有大小和方向。

数学：向量是有序的数字列表。第一个数代表沿x轴走多远，第二个数代表沿y轴走多远。正负表示方向。

竖着写二维向量是为了和点的坐标做区分。

向量加法：

数乘：缩放向量

2. 线性组合、张成的空间、基

向量：缩放向量并且相加

i, j 是xy坐标系的"基向量"。

（3，2）=3i+2j （标量*矢量）

那么选择不同的基向量呢？每当我们用数字描述向量时，它都依赖于我们在使用的基。

两个数乘向量的和被称为这两个向量的线性组合。

v和w全部线性组合构成的向量集合称为"张成的空间"。张成的空间可能是点（基向量为0向量），可能是直线（基向量共线），也可能是无限大的二维平面。

考虑一个向量时，把它看作箭头，考虑多个向量时，将它看作点（避免拥挤）。

u、w、v三维空间中，第三个向量的改变可视为它将前两个向量张成的平面沿它的方向来回移动，从而扫过整个空间。

三个自由变化的标量可得到空间中所有的三维向量。

若存在第三个向量落在前两个向量张成的空间中，即一组向量中至少有一个是多余的，没有对张成空间做出任何贡献，则可移除其中一个。

当这种情况发生时，我们称他们是线性相关的。

因此，向量空间的一组基是张成该空间的一个线性无关向量集。

线性组合->线性相关->线性变换

3. 矩阵与线性变换（将矩阵看作空间变换）

接收一个向量并输出一个向量的变换。使用变换是暗示用"运动"去思考。

线性变换定义：保持网格线平行且等距分布。（变换后直线依然是直线，原点保持固定）。是操纵空间的一种手段。

掌握了基向量的变换，就等于掌握了所有向量的变换。

2*2矩阵：

xy向量作用于abcd矩阵，ac相当于i，bd相当于j。矩阵前后很重要。

把矩阵列看作他们的基向量，把矩阵乘法看作他们的线性变换。

逆时针旋转90°：

4. 矩阵乘法与线性变换复合

下图中的乘积从右向左读，先旋转后剪切。

两个矩阵相乘-->两个线性变换相继作用，分列计算，计算变换后的i，j。

矩阵中(AB)C=A(BC), 左右都是先作C矩阵的线性变换，再做B，A。

三维空间的线性变换

例：沿y轴旋转90°。

计算线性变换后的位置：

5. 行列式

行列式：计算拉伸或压缩后空间的变化。二维空间中则是计算面积的缩放比例。

eg.一个矩阵的行列式=3，就意味着它将一个区域的面积变为原来的3倍。

一个二维线性变换的行列式=0，意味着他将整个区域变换到一条线，甚至一个点上。

因此，只要检验一个矩阵的行列式是否等于0，我们就可以了解这个矩阵所代表的变换是否将空间压缩到更小的维度上。

行列式=0，则存在一个基向量与其他基向量的线性相关的。

行列式=负值，则说明它将空间翻转了。

原本j在i的左边，翻转后j在i的右边。

三维空间中：

右手定则，行列式为正。左手定则，行列式为负。

计算行列式：

二阶：

ad分别说明了基向量在原方向上拉伸倍数，bc项说明平行四边形在对角方向拉伸或压缩了多少。

三阶：

6. 逆矩阵、列空间与零空间

只要A的行列式不为0，求A的逆变换即可求出x。

A的行列式为0，则无法实现从低维到高维的变换，不存在A的逆矩阵。

计算：

秩、列空间、零空间

秩：变换后空间的维数。

三阶矩阵将空间压缩成一维时，我们称这个变换的秩为1，其行列式=0。

三阶矩阵将空间压缩成二维时，我们称这个变换的秩为2，其行列式=0。

若行列式≠0，空间仍是三维的，则说明秩为3。

所有可能变换的结果，被称为矩阵的"列空间"

当秩=列数时，称为满秩。

零向量一定在列空间中。零空间有助于我们理解所有可能的解的集合。

当v向量处于矩阵A的列所张成的空间上，方程就有解。

非方阵

（1）二维输入，三维输出：

2*2 -> 3*2

实际并没有升维，变换后为三维空间中过原点的一个平面。

因为列空间的维数和输入空间的维数相等，这个矩阵仍是满秩的。

（2）三维到二维：

线性变换：

三列表示有三个基向量，每个变换后的基向量用两个坐标描述，所以他们一定落在二维空间中。

因此这是一个从三维到二维的变换，非满秩。

（3）二维到一维：

即从平面到数轴。

7. 点积与对偶性

变换矩阵的列数是基向量的个数，即输入维数。

行数是输出的维数。

点积：a在b方向的投影长度*b的长度（或者b在a方向的投影长度乘上a的长度）。因此，点积与顺序无关。若a，b方向相反，则它们的点积为负值。

若v和w的长度恰好相同 ，我们可以利用其中的对称性。此时v和w互为镜像。

当v变成2v，对称性被破坏，但将v变为原来的2倍并不改变w的投影长度，因此(2v)·w=2(v·w)。换个角度，将2v投影到w上，其投影长度也变为原来的2倍，但w不变，因此总体效果仍然是点积变为2倍。因此，缩放向量对点积的影响是相同的。

点积为什么和投影有所联系？因为对偶性

多维空间到一维空间（数轴）的线性变换。

假设i，j变换到一维空间后分别落在1，2上，则变换矩阵为[1，2].

上一篇：小杰机器学习高级（two）——极大似然估计、交叉熵损失函数

下一篇：机器学习相关内容

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06Window 10部署openclaw报错node.exe : npm error code 128 07OpenClaw优化飞书API 额度已耗尽问题 08Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 09AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 10OpenClaw 接入阿里云百炼 Coding Plan 指南