深度学习 Deep Learning 第2章 线性代数

深度学习 第2章 线性代数

线性代数是深度学习的语言。 张量操作是神经网络计算的基石,矩阵乘法是前向传播的核心,范数约束模型复杂度,而生成空间理论揭示模型表达能力的本质。 本章介绍线性代数的基本内容,为进一步学习深度学习做准备。

主要内容

2.1 标量、向量、矩阵和张量

  • 标量:单个数字,用斜体表示,通常赋予小写字母变量名。
  • 向量:数字数组,按顺序排列,用粗体小写字母表示,元素通过下标访问。
  • 矩阵:二维数字数组,用粗体大写字母表示,元素通过两个索引访问。
  • 张量:多维数字数组,用特殊字体表示,元素通过多个索引访问。

2.2 矩阵和向量的乘法

  • 矩阵乘法:两个矩阵相乘得到第三个矩阵,要求第一个矩阵的列数等于第二个矩阵的行数。
  • 点积:两个向量的点积是它们对应元素乘积的和,结果是一个标量。
  • 矩阵乘法的性质:矩阵乘法是可分配的和结合的,但不具有交换性。

2.3 单位矩阵和逆矩阵

  • 单位矩阵:与任何向量相乘都不会改变该向量的矩阵,主对角线元素为1,其余为0。
  • 逆矩阵:矩阵A的逆矩阵A⁻¹满足A⁻¹A = I,用于求解线性方程组。

2.4 线性相关性和生成空间

  • 线性相关性:一组向量中至少有一个向量可以表示为其他向量的线性组合。
  • 生成空间:一组向量的所有线性组合构成的集合。

2.5 范数

  • Lᵖ范数:衡量向量大小的函数,L¹范数(欧几里得范数)和L²范数常用。
  • 矩阵范数 :衡量矩阵大小的函数,如弗罗贝尼乌斯范数。
    "范数衡量向量大小,L¹鼓励稀疏性,L²平滑但易微分。"

2.6 特殊类型的矩阵和向量

  • 对角矩阵:只有主对角线有非零元素的矩阵。
  • 对称矩阵:等于其转置的矩阵。
  • 正交矩阵:行和列都是标准正交的矩阵。

2.7 特征分解

  • 特征向量和特征值:矩阵A的特征向量v满足Av = λv,λ是对应的特征值。
  • 特征分解:将矩阵分解为特征向量和特征值的组合。

总结

线性代数是深度学习的"语法":

  • 张量作为数据容器,支撑图像、语音等高维数据表示。
  • 矩阵乘法是神经网络前向传播的核心运算(如全连接层)。
  • 范数约束模型复杂度(如正则化项)
  • 生成空间理论解释模型表达能力
  • 线性相关性直接影响参数优化稳定性。
    掌握这些概念,可深入理解神经网络的计算本质与设计逻辑。

延伸思考

深度学习视角:张量(高维数组)是神经网络中数据的通用表示形式(如图像=3D张量)。

实践意义:广播机制(broadcasting)允许不同维度张量运算,是框架(如PyTorch)高效实现的关键。掌握这些内容,就握住了理解深度学习模型的钥匙!

精彩语句

  1. 英文"A vector can be regarded as a point in space, with each element corresponding to a position on a different coordinate axis."
    中文 :向量可视为空间中的点,每个元素对应不同坐标轴的位置。
    解释:从几何视角连接代数与空间,奠定线性组合的直观基础。

  2. 英文"Matrix multiplication is not an element-wise product, but a linear combination of rows and columns."
    中文 :矩阵乘法是行与列的线性组合,而非逐元素乘积。
    解释:揭示神经网络中权重与输入交互的本质(如全连接层计算)。

  3. 英文"The inverse of an orthogonal matrix is its transpose, making computations highly efficient."
    中文 :正交矩阵的逆即其转置,计算成本极低。
    解释:正交性在梯度稳定性和参数初始化中的关键作用(如防止梯度爆炸)。

  4. 英文"Norms measure the size of vectors: L¹ encourages sparsity, while L² is smooth and differentiable."
    中文 :范数衡量向量大小:L¹ 鼓励稀疏性,L² 平滑且易微分。
    解释:指导损失函数设计(如Lasso回归与岭回归的正则化选择)。

相关推荐
无你想你20 分钟前
DataWhale大语言模型-大模型技术基础
人工智能·语言模型·自然语言处理
背太阳的牧羊人20 分钟前
LLaMA-Factory 训练数据默认使用 instruction、input、output 三个 key
人工智能·llama·大模型微调
后端小肥肠29 分钟前
基于RAGFlow本地部署DeepSpeek-R1大模型与知识库:从配置到应用的全流程解析
人工智能·ai
struggle202540 分钟前
Browser Copilot 开源浏览器扩展,使用现有或定制的 AI 助手来完成日常 Web 应用程序任务。
人工智能·自然语言处理·数据分析·自动化·copilot·deepseek
Sheakan1 小时前
【文献阅读】DeepRAG:大语言模型的检索增强推理新范式
人工智能·语言模型·自然语言处理
meisongqing1 小时前
目前人工智能的发展,判断10年、20年后的人工智能发展的主要方向,或者带动的主要产业
人工智能
李加号pluuuus1 小时前
【数据集】CelebA Dataset
人工智能·计算机视觉
pen-ai1 小时前
【NLP】 9. 处理创造性词汇 & 词组特征(Creative Words & Features Model), 词袋模型处理未知词,模型得分
人工智能·深度学习·自然语言处理
寻丶幽风1 小时前
论文阅读笔记——QLORA: Efficient Finetuning of Quantized LLMs
论文阅读·人工智能·笔记·深度学习·语言模型