201_深度学习的数学底座:PyTorch 线性代数与范数实战

在深度学习中,数据以张量(Tensor)的形式流动,而模型参数的更新则依赖于矩阵运算。掌握 PyTorch 中的线性代数操作,不仅能帮你理解算法原理,更能让你写出高性能的计算代码。

1. 核心数学对象:从标量到张量

笔记中详细介绍了四种基础数学对象的定义与操作:

  • 标量 (Scalar):只有一个元素的张量。
  • 向量 (Vector):一阶张量,通常表示特征。
  • 矩阵 (Matrix):二阶张量,用于表示权重或数据集。
  • 张量 (Tensor):更一般的 N 维数组。

2. 核心代码:特征值与特征向量

在线性变换中,特征值和特征向量揭示了矩阵变换的方向和缩放比例,这在主成分分析(PCA)等降维算法中至关重要。

Python

复制代码
import torch

# 定义一个方阵
A = torch.tensor([[1.0, 2.0], [2.0, 1.0]])

# 求解特征值 (eigenvalues) 和 特征向量 (eigenvectors)
# 在新版 PyTorch 中建议使用 torch.linalg.eig
eigenvalues, eigenvectors = torch.linalg.eig(A)

print(f"特征值: {eigenvalues}")
print(f"特征向量: {eigenvectors}")

3. 范数(Norm):衡量"大小"的尺度

在深度学习的**正则化(Regularization)**中,我们经常听到 L1 范数和 L2 范数。它们本质上是衡量向量或矩阵"长度"或"大小"的函数。

① L1 范数

  • 定义:向量元素的绝对值之和。
  • 用途:倾向于产生稀疏解(让不重要的权重变为 0)。
  • 代码torch.abs(u).sum()

② L2 范数

  • 定义:向量元素平方和的平方根(欧几里得距离)。
  • 用途:最常用的权值衰减方式,防止过拟合。
  • 代码torch.norm(u)

③ 矩阵 F 范数 (Frobenius norm)

  • 定义:矩阵所有元素平方和的平方根。
  • 代码实现

Python

复制代码
# 将矩阵拉成向量求 L2 范数,即为 F 范数
X = torch.ones((4, 9))
f_norm = torch.norm(X) 
print(f"矩阵的 Frobenius 范数: {f_norm}") # 输出应为 6.0 (sqrt(36))

4. 常见的矩阵运算技巧

笔记中还涵盖了一些高频使用的矩阵函数:

  • 转置 (Transpose)A.T,交换行与列。
  • 对称矩阵 :如果 A == A.T,则 A 是对称矩阵。
  • 哈达玛积 (Hadamard Product)A * B,两个形状相同的矩阵对应元素相乘。
  • 点积 (Dot Product)torch.dot(x, y),两个向量的内积。
  • 矩阵-向量积torch.mv(A, x)
  • 矩阵-矩阵乘法torch.mm(A, B)

5. 总结:线性代数如何赋能深度学习?

分析该文件后,我们可以发现线性代数在深度学习中的具体应用点:

  1. 参数存储:权重 W 和偏置 b 全部存储在矩阵和向量中。
  2. 损失控制 :通过计算权重的 范数 并将其加入损失函数,实现模型正则化。
  3. 降维与压缩 :利用 特征值分解 或 SVD 压缩模型参数,减少计算量。

💡 学习小结

不要被复杂的公式吓倒,在 PyTorch 中,这些复杂的数学变换都被浓缩成了简单的函数。理解了范数的物理意义和矩阵乘法的几何意义,你就掌握了深度学习算法的"灵魂"

相关推荐
盼小辉丶2 小时前
PyTorch实战(38)——深度学习模型可解释性
人工智能·pytorch·深度学习
温九味闻醉2 小时前
Meta | HSTU:生成式推荐工业级方案
人工智能·深度学习·机器学习
香芋超新星2 小时前
服务器根目录爆满导致 PyTorch 安装失败(Errno 28 No space left on device)
服务器·pytorch·深度学习
sin°θ_陈2 小时前
前馈式3D Gaussian Splatting 研究地图(路线一):像素对齐高斯的起点——pixelSplat 与 latentSplat 在解决什么
python·深度学习·3d·aigc·webgl·3dgs·空间智能
junior_Xin2 小时前
机器学习深度学习beginning3
深度学习·机器学习
放下华子我只抽RuiKe52 小时前
深度学习学习路径规划
人工智能·深度学习·学习·github·ai agent·openclaw·development
金融小师妹2 小时前
局势边际缓和下的AI定价重构:金价4500关口面临路径选择与约束机制
大数据·深度学习·能源
纤纡.2 小时前
从基础 CNN 到优化模型:食品图像分类全流程对比实战
人工智能·python·深度学习
大连好光景2 小时前
静态融合特征做分类任务(监督)
深度学习·机器学习·分类