


基础技能需求
1. 数学基础:
不要听到"数学"就色变。在 AI 的工程实践中,我们更多是调用现成的数学库(如 Numpy),而不是手推复杂的公式。你只需要理解核心概念的几何意义 和物理直觉。
- 线性代数 (Linear Algebra):
- 必须掌握: 标量、向量、矩阵的概念。知道矩阵乘法(行乘以列)是怎么算的。
- 为什么需要: 神经网络的数据流本质上就是大规模的矩阵运算。
- 微积分 (Calculus):
- 必须掌握: 导数(Derivative)和偏导数的概念。
- 直觉理解: 导数就是斜率,就是变化率。
- 为什么需要: 所有的神经网络训练(梯度下降)本质上都在做一件事:求导。
- 概率统计 (Probability):
- 必须掌握: 正态分布(高斯分布)、期望、方差。
- 为什么需要: AI 处理的是不确定性,很多模型(如扩散模型)都是建立在概率分布之上的。
2. 编程能力:Python 是唯一通用语
如果你已经掌握 Java、C++ 或 JavaScript,转行 Python 只需要一下午。
- Python 基础:
- 变量、列表 (List)、字典 (Dictionary)、循环 (For/While)、函数 (Function)。
- 类与对象 (Class & Object):虽然不用写很复杂的架构,但要理解面向对象,因为 PyTorch 的模型都是继承自一个基类的。
- 核心库 (Libraries):
- Numpy: 数值计算的瑞士军刀(本书第 2 章会速成)。
- Pandas: AI 界的 Excel。
- Matplotlib: 用来画图表,把枯燥的数据可视化。
3. 英语能力:读懂文档是底线
AI 领域发展太快了,最新的论文(ArXiv)、最好的文档(Hugging Face)、最热的讨论(Reddit/Twitter)全都是英文的。
- 要求: 不需要你能流利对话,但需要你能借助翻译插件读懂技术文档,看懂报错信息(StackOverflow)。
- 术语: 书中会保留核心术语的英文原词(如 Loss Function , Overfitting , Tokenization),因为在工作中大家只说英文术语。
4. 硬件环境:甚至不需要显卡
- 入门阶段: 一台普通的笔记本电脑足矣(Windows/Mac/Linux 均可)。
- 云端算力(推荐):
- Google Colab:谷歌提供的免费云端 Jupyter Notebook,赠送免费的 GPU(T4)
- Kaggle Kernels:无需配置,打开浏览器就能写代码。
- 进阶阶段: 如果你想在本地跑大模型,推荐配备 NVIDIA 显卡(至少 8GB 显存,推荐 RTX 3060/4060 及以上)。注:AMD 和 Mac M系列芯片目前支持度在变好,但为了少折腾,N 卡依然是首选。
5. 心理建设:拥抱"黑盒"
这是程序员转行 AI 最大的障碍。
- 传统编程: 逻辑是确定的。
if a > b,结果必然是 True 或 False。如果有 Bug,一定是你逻辑写错了。 - AI 编程: 逻辑是概率的。你写了完美的代码,模型准确率可能只有 80%。
- 心态转变: 学会接受"不确定性"。很多时候,训练 AI 像是在"炼丹"------你需要调整火候(超参数),而不是重写炉子。你需要耐心,更需要像侦探一样去分析数据背后的规律。
武器库或者工具箱
第一层:基础武器库(必备的内功心法)
目标: 掌握与 AI 世界沟通的语言和思维方式。这是所有一切的基石。
-
编程语言:Python (The "母语" of AI)
-
为什么学? Python 是 AI 领域的绝对统治者。它语法简洁,就像写英语一样自然,而且拥有极其庞大的 AI 生态库。不学 Python,就没法进入 AI 的大门。
-
学什么? 基础语法、变量、循环、函数、面向对象编程。
-
-
数据科学三剑客:NumPy, Pandas, Matplotlib
-
为什么学? AI 的核心是数据处理。你需要工具来高效地操作数据。
-
NumPy: 帮你处理大规模的数字矩阵(线性代数的核心)。
-
Pandas: 就像 Excel 的加强版,帮你处理表格数据(清洗、筛选、统计)。
-
Matplotlib/Seaborn: 把枯燥的数据画成直观的图表,让你一眼看穿数据的规律。
-
-
必要的数学直觉(Math Intuition)
-
为什么学? 别怕!我们不搞复杂的公式推导。但你需要理解算法背后的数学原理,否则你只会被当作"调包侠"。
-
学什么?
-
线性代数: 理解矩阵运算,知道数据是怎么在网络里流动的。
-
微积分(梯度下降): 理解机器是怎么"学习"和"改进"自己的(核心中的核心)。
-
概率统计: 理解如何在这个不确定的世界里进行预测和决策。
-
-
第二层:经典兵器库(机器学习的瑞士军刀)
目标: 掌握处理结构化数据(表格数据)的经典算法,培养模型思维。
-
机器学习框架:Scikit-learn (sklearn)
- 为什么学? 这是传统机器学习领域最权威、最好用的 Python 库。它封装了几乎所有经典的算法,让你几行代码就能调用强大的模型。
-
经典算法矩阵
-
预测数值(回归): 线性回归,帮你预测房价、气温。
-
进行分类(判断): 逻辑回归、决策树、随机森林、支持向量机 (SVM)。帮你判断邮件是不是垃圾、肿瘤是不是恶性。
-
探索数据(聚类与降维): K-Means 聚类、PCA 降维。帮你把用户分成不同的群体,或者把复杂的数据简化。
-
第三层:重型武器库(深度学习的核武器)
目标: 进入神经网络的世界,赋予机器感知能力(看图、听音、读文)。
-
深度学习框架:PyTorch (或 TensorFlow)
- 为什么学? 到了深度学习,模型结构太复杂,不能再手写了。你需要一个强大的框架来帮你搭建神经网络、自动计算梯度、利用 GPU 加速。PyTorch 是目前学术界和研究领域最流行的选择,因为它灵活且易于调试。
-
核心领域技能
-
计算机视觉 (CV): 学习卷积神经网络 (CNN),让机器能识别图像、检测物体。
-
自然语言处理 (NLP): 学习循环神经网络 (RNN) 和 Transformer,让机器能理解文本、进行翻译。
-
第四层:未来科技库(大模型与 AIGC)
目标: 站在技术的最前沿,驾驭生成式 AI 的力量。
-
大模型架构:Transformer
- 为什么学? 它是 ChatGPT、BERT 等所有现代大模型的基石。理解了它,就理解了现代 AI。
-
提示工程 (Prompt Engineering)
- 为什么学? 在大模型时代,学会如何向 AI 提问,比自己写代码更重要。这是一种新的编程方式。
-
大模型生态工具:Hugging Face & LangChain
-
Hugging Face: AI 界的 GitHub,这里有无数开源的预训练大模型等你免费调用。
-
LangChain: 一个强大的框架,帮你把大模型连接到你的本地数据、PDF 文档或搜索引擎上,构建专属的 AI 应用。
-
