从深度学习角度看线性代数

线性代数

标量由于没有方向，因此只考虑大小，运算直接加减乘除即可。

矩阵其实是将空间进行了扭曲。了解即可

矩阵相乘公式如下：

实现

首先介绍标量：

(标量由只有一个元素的张量表示 )。

下面的代码将实例化两个标量，并执行一些熟悉的算术运算，即加法、乘法、除法和指数。

python 复制代码

import torch

x = torch.tensor(3.0)
y = torch.tensor(2.0)

x + y, x * y, x / y, x**y
# answer : (tensor(5.), tensor(6.), tensor(1.5000), tensor(9.))

向量

(∥ x ∥ 2 = ∑ i = 1 n x i 2 , \|\mathbf{x}\|2 = \sqrt{\sum{i=1}^n x_i^2}, ∥x∥2=i=1∑nxi2 , )

其中，在 L 2 L_2 L2范数中常常省略下标 2 2 2，也就是说 ∥ x ∥ \|\mathbf{x}\| ∥x∥等同于 ∥ x ∥ 2 \|\mathbf{x}\|_2 ∥x∥2。在代码中，可以按如下方式计算向量的 L 2 L_2 L2范数。

python 复制代码

u = torch.tensor([3.0, -4.0])
torch.norm(u)
output :
tensor(5.)

深度学习中更经常地使用 L 2 L_2 L2范数的平方，也会经常遇到[L 1 L_1 L1范数，它表示为向量元素的绝对值之和： ] ∥ x ∥ 1 = ∑ i = 1 n ∣ x i ∣ . \|\mathbf{x}\|1 = \sum{i=1}^n \left|x_i \right|. ∥x∥1=i=1∑n∣xi∣.与 L 2 L_2 L2范数相比， L 1 L_1 L1范数受异常值的影响较小。

为了计算 L 1 L_1 L1范数，我们将绝对值函数和按元素求和组合起来。

python 复制代码

torch.abs(u).sum()
# 先将u中的每个元素求绝对值，然后进行求和即可
output :
tensor(7.)

L 2 L_2 L2范数和 L 1 L_1 L1范数都是更一般的 L p L_p Lp范数的特例： ∥ x ∥ p = ( ∑ i = 1 n ∣ x i ∣ p ) 1 / p . \|\mathbf{x}\|p = \left(\sum{i=1}^n \left|x_i \right|^p \right)^{1/p}. ∥x∥p=(i=1∑n∣xi∣p)1/p.类似于向量的 L 2 L_2 L2范数，[矩阵 ] X ∈ R m × n \mathbf{X} \in \mathbb{R}^{m \times n} X∈Rm×n(的Frobenius范数（Frobenius norm）是矩阵元素平方和的平方根： ) ∥ X ∥ F = ∑ i = 1 m ∑ j = 1 n x i j 2 . \|\mathbf{X}\|F = \sqrt{\sum{i=1}^m \sum_{j=1}^n x_{ij}^2}. ∥X∥F=i=1∑mj=1∑nxij2 .

Frobenius范数满足向量范数的所有性质，它就像是矩阵形向量的 L 2 L_2 L2范数。

调用以下函数将计算矩阵的Frobenius范数。

python 复制代码

torch.norm(torch.ones((4, 9)))
output :
tensor(6.)

按特定轴求和

关于按特定轴求和，笔者之前也不是很清楚，但是观看了李沐老师的视频后，还是深松启发的，具体来说，就一张图可以总结：

上图表示axis等于几，就将张量的第几维去掉即可。

要是使用了keepdims = True,这保留该维度，但是该维度变成1。

QA 思考

copy 与 clone 的区别：

copy 有深拷贝和浅拷贝的区别，clone是复制新内存。

求和简单来理解，就是对哪一维求和就是消除那一维度。