深度学习 Deep Learning 第2章线性代数

深度学习第2章线性代数

线性代数是深度学习的语言。张量操作是神经网络计算的基石，矩阵乘法是前向传播的核心，范数约束模型复杂度，而生成空间理论揭示模型表达能力的本质。本章介绍线性代数的基本内容，为进一步学习深度学习做准备。

线性代数是深度学习的"语法"：

深度学习视角：张量（高维数组）是神经网络中数据的通用表示形式（如图像=3D张量）。

实践意义：广播机制（broadcasting）允许不同维度张量运算，是框架（如PyTorch）高效实现的关键。掌握这些内容，就握住了理解深度学习模型的钥匙！

英文："A vector can be regarded as a point in space, with each element corresponding to a position on a different coordinate axis."
中文：向量可视为空间中的点，每个元素对应不同坐标轴的位置。
解释：从几何视角连接代数与空间，奠定线性组合的直观基础。
英文："Matrix multiplication is not an element-wise product, but a linear combination of rows and columns."
中文：矩阵乘法是行与列的线性组合，而非逐元素乘积。
解释：揭示神经网络中权重与输入交互的本质（如全连接层计算）。
英文："The inverse of an orthogonal matrix is its transpose, making computations highly efficient."
中文：正交矩阵的逆即其转置，计算成本极低。
解释：正交性在梯度稳定性和参数初始化中的关键作用（如防止梯度爆炸）。
英文："Norms measure the size of vectors: L¹ encourages sparsity, while L² is smooth and differentiable."
中文：范数衡量向量大小：L¹ 鼓励稀疏性，L² 平滑且易微分。
解释：指导损失函数设计（如Lasso回归与岭回归的正则化选择）。