从零开始学AI4——背景知识3

不要听到"数学"就色变。在 AI 的工程实践中，我们更多是调用现成的数学库（如 Numpy），而不是手推复杂的公式。你只需要理解核心概念的几何意义 和物理直觉。

线性代数 (Linear Algebra)：
- 必须掌握： 标量、向量、矩阵的概念。知道矩阵乘法（行乘以列）是怎么算的。
- 为什么需要： 神经网络的数据流本质上就是大规模的矩阵运算。
微积分 (Calculus)：
- 必须掌握： 导数（Derivative）和偏导数的概念。
- 直觉理解： 导数就是斜率，就是变化率。
- 为什么需要： 所有的神经网络训练（梯度下降）本质上都在做一件事：求导。
概率统计 (Probability)：
- 必须掌握： 正态分布（高斯分布）、期望、方差。
- 为什么需要： AI 处理的是不确定性，很多模型（如扩散模型）都是建立在概率分布之上的。

如果你已经掌握 Java、C++ 或 JavaScript，转行 Python 只需要一下午。

Python 基础：
- 变量、列表 (List)、字典 (Dictionary)、循环 (For/While)、函数 (Function)。
- 类与对象 (Class & Object)：虽然不用写很复杂的架构，但要理解面向对象，因为 PyTorch 的模型都是继承自一个基类的。
核心库 (Libraries)：
- Numpy： 数值计算的瑞士军刀（本书第 2 章会速成）。
- Pandas： AI 界的 Excel。
- Matplotlib： 用来画图表，把枯燥的数据可视化。

AI 领域发展太快了，最新的论文（ArXiv）、最好的文档（Hugging Face）、最热的讨论（Reddit/Twitter）全都是英文的。

要求： 不需要你能流利对话，但需要你能借助翻译插件读懂技术文档，看懂报错信息（StackOverflow）。
术语： 书中会保留核心术语的英文原词（如 Loss Function , Overfitting , Tokenization），因为在工作中大家只说英文术语。

入门阶段： 一台普通的笔记本电脑足矣（Windows/Mac/Linux 均可）。
云端算力（推荐）：
- Google Colab：谷歌提供的免费云端 Jupyter Notebook，赠送免费的 GPU（T4）
- Kaggle Kernels：无需配置，打开浏览器就能写代码。
进阶阶段： 如果你想在本地跑大模型，推荐配备 NVIDIA 显卡（至少 8GB 显存，推荐 RTX 3060/4060 及以上）。注：AMD 和 Mac M系列芯片目前支持度在变好，但为了少折腾，N 卡依然是首选。

这是程序员转行 AI 最大的障碍。

传统编程： 逻辑是确定的。if a > b，结果必然是 True 或 False。如果有 Bug，一定是你逻辑写错了。
AI 编程： 逻辑是概率的。你写了完美的代码，模型准确率可能只有 80%。
心态转变： 学会接受"不确定性"。很多时候，训练 AI 像是在"炼丹"------你需要调整火候（超参数），而不是重写炉子。你需要耐心，更需要像侦探一样去分析数据背后的规律。

目标： 掌握与 AI 世界沟通的语言和思维方式。这是所有一切的基石。

编程语言：Python (The "母语" of AI)
- 为什么学？ Python 是 AI 领域的绝对统治者。它语法简洁，就像写英语一样自然，而且拥有极其庞大的 AI 生态库。不学 Python，就没法进入 AI 的大门。
- 学什么？ 基础语法、变量、循环、函数、面向对象编程。
数据科学三剑客：NumPy, Pandas, Matplotlib
- 为什么学？ AI 的核心是数据处理。你需要工具来高效地操作数据。
- NumPy： 帮你处理大规模的数字矩阵（线性代数的核心）。
- Pandas： 就像 Excel 的加强版，帮你处理表格数据（清洗、筛选、统计）。
- Matplotlib/Seaborn： 把枯燥的数据画成直观的图表，让你一眼看穿数据的规律。
必要的数学直觉（Math Intuition）
- 为什么学？ 别怕！我们不搞复杂的公式推导。但你需要理解算法背后的数学原理，否则你只会被当作"调包侠"。
- 学什么？
  - 线性代数： 理解矩阵运算，知道数据是怎么在网络里流动的。
  - 微积分（梯度下降）： 理解机器是怎么"学习"和"改进"自己的（核心中的核心）。
  - 概率统计： 理解如何在这个不确定的世界里进行预测和决策。

目标： 掌握处理结构化数据（表格数据）的经典算法，培养模型思维。

机器学习框架：Scikit-learn (sklearn)
- 为什么学？ 这是传统机器学习领域最权威、最好用的 Python 库。它封装了几乎所有经典的算法，让你几行代码就能调用强大的模型。
经典算法矩阵
- 预测数值（回归）： 线性回归，帮你预测房价、气温。
- 进行分类（判断）： 逻辑回归、决策树、随机森林、支持向量机 (SVM)。帮你判断邮件是不是垃圾、肿瘤是不是恶性。
- 探索数据（聚类与降维）： K-Means 聚类、PCA 降维。帮你把用户分成不同的群体，或者把复杂的数据简化。

目标： 进入神经网络的世界，赋予机器感知能力（看图、听音、读文）。

深度学习框架：PyTorch (或 TensorFlow)
- 为什么学？ 到了深度学习，模型结构太复杂，不能再手写了。你需要一个强大的框架来帮你搭建神经网络、自动计算梯度、利用 GPU 加速。PyTorch 是目前学术界和研究领域最流行的选择，因为它灵活且易于调试。
核心领域技能
- 计算机视觉 (CV)： 学习卷积神经网络 (CNN)，让机器能识别图像、检测物体。
- 自然语言处理 (NLP)： 学习循环神经网络 (RNN) 和 Transformer，让机器能理解文本、进行翻译。

目标： 站在技术的最前沿，驾驭生成式 AI 的力量。

大模型架构：Transformer
- 为什么学？ 它是 ChatGPT、BERT 等所有现代大模型的基石。理解了它，就理解了现代 AI。
提示工程 (Prompt Engineering)
- 为什么学？ 在大模型时代，学会如何向 AI 提问，比自己写代码更重要。这是一种新的编程方式。
大模型生态工具：Hugging Face & LangChain
- Hugging Face： AI 界的 GitHub，这里有无数开源的预训练大模型等你免费调用。
- LangChain： 一个强大的框架，帮你把大模型连接到你的本地数据、PDF 文档或搜索引擎上，构建专属的 AI 应用。