从零开始学AI5——数学应知应会0

本文用通俗易懂的方式讲解了AI背后的三大数学基石：线性代数、微积分和概率统计。线性代数作为"数据容器"和"计算引擎"，通过矩阵运算实现高效并行计算；微积分作为"指南针"，通过梯度下降算法指引AI优化方向；概率统计作为"水晶球"，帮助AI处理不确定性并实现创造性输出。文章通过切菜、调味等生活化比喻，生动阐释了这些数学概念在AI中的实际应用，包括神经网络计算、参数优化和生成式AI创作等核心功能，让读者理解数学如何赋予AI思考和创造的能力。

半专业讲解，后面还有大白话讲解

https://www.thepaper.cn/newsDetail_forward_9939482

线性代数 ------ AI 的"数据容器"与"计算引擎"

如果在传统编程中，最重要的数据结构是"数组"和"链表"；那么在 AI 编程中，至高无上的神只有一种：张量 (Tensor)。

而线性代数，就是操作张量的说明书。

1. 数据的三种形态：从点到面

在 AI 的眼里，万物皆可数字化。不管是一张照片、一段声音还是一句"我爱你"，最终都会变成一堆数字。为了管理这些数字，我们定义了三种容器：

标量 (Scalar) ------ 一个点
- 定义： 只有一个单独的数字。
- 例子： x = 5。
- 在 AI 中： 它可以代表损失函数的值（Loss = 0.02），或者学习率（lr = 0.001）。它没有方向，只有大小。
向量 (Vector) ------ 一条线
- 定义： 一排有序的数字。
- 例子： x = [170, 65]。
- 在 AI 中： 它可以代表一个人的特征：[身高 170cm, 体重 65kg]。或者一个单词在空间中的坐标。
- 几何意义： 它是多维空间中的一个箭头。
矩阵 (Matrix) ------ 一个面
- 定义： 一个二维的表格（行 × 列）。
- 例子： 一个 Excel 表格。
- 在 AI 中： 它可以代表一张黑白照片（像素点阵），或者是一次性打包处理的 100 个人的数据。

注：你以后还会听到 "张量 (Tensor)" 这个词。别怕，它只是通用的叫法：

0 阶张量 = 标量

1 阶张量 = 向量

2 阶张量 = 矩阵

3 阶及以上 = 高维数组（比如彩色照片是 3 阶：高 × 宽 × RGB 三通道）

2. 核心运算：矩阵乘法 (Matrix Multiplication)

在神经网络中，90% 的计算量都是矩阵乘法。如果你理解了它，你就理解了 AI 是如何"思考"的。

规则：行 × 列 (Row by Column)

假设我们要计算矩阵 AA 乘以矩阵 BB，得到矩阵 CC。

即 A×B=CA×B=C。

操作步骤：

拿出 AA 的第一行。
拿出 BB 的第一列。
对应元素相乘，然后相加（点积 Dot Product）。
这个结果，就是 CC 中第一行第一列的那个数字。

举个栗子（心算一下）：