AI Engineering from Scratch:从数学基础到智能体工程,一套 435 课的 AI 工程实战路线图

前言:项目简介

近两年,AI 工程已经从"会调用 API"逐渐转向"能理解原理、能搭建系统、能部署产品"。很多学习者可以快速搭建一个 Chatbot,也能使用 LangChain、LlamaIndex、OpenAI API 或 Claude API 完成 Demo,但一旦涉及模型训练、注意力机制、RAG 评估、Agent Loop、MCP Server、多智能体系统、生产部署与安全治理,往往会发现知识体系是碎片化的。

AI Engineering from Scratch 正是为了解决这个问题而设计的开源课程项目。项目 slogan 是:

复制代码
Learn it. Build it. Ship it for others.

也就是说,它并不满足于"学会概念",而是要求学习者经历完整闭环:

复制代码
理解原理 → 手写实现 → 运行测试 → 产出可复用工具 → 面向真实场景交付

项目 README 显示,该课程目前包含 435 lessons、20 phases、约 320 小时内容 ,覆盖 Python、TypeScript、Rust、Julia 等语言。每一课都会产出一个可复用 artifact,例如 prompt、skill、agent 或 MCP server。项目强调"不是只学习 AI,而是从零开始构建 AI 系统"。(GitHub)

从定位上看,它不是普通 AI 入门教程,而更像是一套 AI Engineering Reference Manual:从线性代数、机器学习、深度学习、计算机视觉、NLP、Transformer、LLM、RAG、MCP、Agent、多智能体,到生产部署、安全对齐和最终 Capstone 项目,形成一条完整的工程化学习路径。


一、发布时间与项目状态

截至本文撰写时,GitHub 页面显示该仓库为公开项目,仓库名为:

复制代码
rohitg00/ai-engineering-from-scratch

项目目前已有约 9.5k stars、1.9k forks ,主分支为 main,仓库历史显示已有 1,046 commits 。(GitHub)

从提交记录来看,项目在 2026 年 5 月 20 日 仍然保持活跃更新,当天合并了多个 PR,包括 lesson run script、README counts drift check、audit backlog、strict CI、link check script 等。(GitHub)

CHANGELOG.md 可以看到,项目在 2026 年 4 月 完成了 Phase 4 Computer Vision,共 28 节课,覆盖从图像基础到多模态视觉、3D、视频和自监督学习等内容;更早的 2026-Q1 阶段已经完成 Phase 0、Phase 1、Phase 2,以及 Phase 3 的核心课程,并构建了网站、术语表和 20 个阶段的初始结构。(GitHub)

项目 README 中还显示,该项目采用 MIT License ,允许 fork、教学、销售和交付,署名是鼓励但不是强制要求。(GitHub)

简单概括:

项目项 内容
项目名称 AI Engineering from Scratch
GitHub 仓库 rohitg00/ai-engineering-from-scratch
项目定位 AI 工程从零构建课程 / 实战手册
当前规模 435 lessons、20 phases、约 320 小时
技术栈 Python、TypeScript、Rust、Julia
主要产出 prompt、skill、agent、MCP server
开源协议 MIT
当前状态 持续活跃更新

二、项目框架设计

该项目的核心框架可以总结为:

复制代码
20 个阶段
435 节课程
每课一个独立目录
每课一个可运行代码实现
每课一个可复用 artifact
最终形成 AI 工程作品集

GitHub README 中展示了项目目录结构,主要包括:

复制代码
ai-engineering-from-scratch
├── .claude/skills
├── .github
├── assets
├── glossary
├── outputs
├── phases
├── projects
├── scripts
├── site
├── web
├── CHANGELOG.md
├── CODE_OF_CONDUCT.md
├── CONTRIBUTING.md
├── FORKING.md
├── LESSON_TEMPLATE.md
├── LICENSE
├── README.md
├── ROADMAP.md
├── SPONSORS.md
├── catalog.json
├── requirements.txt
└── vercel.json

其中,最核心的是 phases/outputs/projects/scripts/.claude/skills


1. phases:课程主体

项目 README 中说明,整个课程由 20 个 phases 组成,底层是数学基础,顶层是 Agent、生产部署和 Capstone 项目。README 明确给出阶段关系:Phase 0 是环境与工具,Phase 1 是数学基础,Phase 2 是机器学习基础,Phase 3 是深度学习核心,然后继续扩展到 CV、NLP、Speech、Transformer、GenAI、RL、LLM、LLM Engineering、Multimodal、MCP、Agent、多智能体、生产基础设施、安全对齐和最终项目。(GitHub)

可以理解为如下路径:

复制代码
Phase 0  Setup & Tooling
Phase 1  Math Foundations
Phase 2  ML Fundamentals
Phase 3  Deep Learning Core
Phase 4  Computer Vision
Phase 5  NLP
Phase 6  Speech & Audio
Phase 7  Transformers
Phase 8  Generative AI
Phase 9  Reinforcement Learning
Phase 10 LLMs from Scratch
Phase 11 LLM Engineering
Phase 12 Multimodal AI
Phase 13 Tools & Protocols
Phase 14 Agent Engineering
Phase 15 Autonomous Systems
Phase 16 Multi-Agent & Swarms
Phase 17 Infrastructure & Production
Phase 18 Ethics & Alignment
Phase 19 Capstone Projects

这种设计非常适合系统学习 AI 工程,因为它不是从 API 开始,而是先建立数学、算法、模型和系统工程基础,然后再进入大模型应用和智能体系统。


2. 每节课的统一结构

项目规定每一节课都放在独立目录中,并采用统一结构:

复制代码
phases/<NN>-<phase-name>/<NN>-<lesson-name>/
├── code/       可运行实现
├── docs/
│   └── en.md   课程讲解文档
└── outputs/    本课产出的 prompt、skill、agent 或 MCP server

README 中明确说明,每节课都遵循同样结构,并且每一课会经历固定学习流程:motto、problem、concept、build it、use it、ship it。(GitHub)

也就是说,每节课不是简单"看一篇教程",而是一个完整的工程小闭环:

复制代码
MOTTO:一句话抓住核心思想
PROBLEM:说明实际痛点
CONCEPT:建立直觉和图解理解
BUILD IT:从原始数学和代码手写实现
USE IT:用 PyTorch / sklearn 等生产框架复现
SHIP IT:输出 prompt、skill、agent 或 MCP 工具

3. outputs:从课程产出真实工具

该项目的一个关键设计是:每节课都会产出 reusable artifact。README 中说明,课程的 outputs/ 会包含 prompts 和 skills,最终这些产物可以安装到 Claude、Cursor、Codex、OpenClaw、Hermes 或任何支持 SKILL.md 的 agent 中。(GitHub)

换句话说,它不是"学完就结束",而是要求你把课程内容转化为可复用工具。例如:

复制代码
学习 loss function → 产出 loss debugger prompt
学习 agent loop → 产出 ReAct-style agent skill
学习 MCP → 产出 MCP server
学习 RAG → 产出 RAG pipeline / evaluator

这种设计使课程天然带有作品集属性。


4. projects:最终可交付项目

Phase 19 是 Capstone Projects,README 中列出了 17 个端到端项目,每个项目大约 20--40 小时,包括 Terminal-Native Coding Agent、Codebase RAG、Real-Time Voice Assistant、Multimodal Document QA、Autonomous Research Agent、DevOps Troubleshooting Agent、Speculative-Decoding Inference Server、GitHub Issue-to-PR Autonomous Agent 等。(GitHub)

这说明项目最终目标不是"学完理论",而是让学习者能交付真实 AI 工程产品。


三、关键功能解析与技术破局

1. 从"碎片化 AI 学习"变成"工程化主线"

很多 AI 学习资料存在一个问题:今天学一点 Prompt Engineering,明天学一点 RAG,后天看一篇 Transformer 论文,再之后照着教程调一个模型。知识很多,但缺少主线。

该项目的技术破局在于,它把 AI 工程拆成 20 个连续阶段:

复制代码
数学基础
→ 机器学习
→ 深度学习
→ CV / NLP / Speech
→ Transformer
→ GenAI / RL
→ LLM from Scratch
→ LLM Engineering
→ Multimodal
→ Tools & Protocols
→ Agent Engineering
→ Multi-Agent
→ Production
→ Safety
→ Capstone

README 中也明确指出,普通 AI 材料往往是零散的,而该课程试图提供一条 spine,也就是学习主干。(GitHub)

这对于 AI 工程师非常重要。因为真实项目往往不是单一知识点,而是算法、数据、模型、系统、部署、安全和产品之间的综合工程。


2. Build It / Use It:先手写,再用框架

该项目最有价值的教学思想之一是:

复制代码
Build It first, Use It later.

README 中说明,每一课都会先从原始数学和代码开始实现算法,然后再使用 PyTorch、sklearn 等生产框架实现同样功能。这样做的目的是:当学习者使用框架时,已经理解框架内部到底在做什么。(GitHub)

例如学习 Transformer 时,不是直接调用 transformers 库,而是先理解:

复制代码
Tokenization
Embedding
Self-Attention
Multi-Head Attention
Position Encoding / RoPE
Feed Forward Network
LayerNorm
KV Cache
Inference Optimization

然后再进入 PyTorch / Hugging Face / 推理优化框架。

这种路线特别适合希望从"调包工程师"进阶为"AI 系统工程师"的学习者。


3. 每课交付 artifact:把知识转化为工具

项目不是只要求完成代码,而是要求每节课都产出可复用 artifact。README 中明确说明,每课会产出 prompt、skill、agent 或 MCP server,最终会形成 435 个你真正理解的工具。(GitHub)

这背后是一个很重要的工程理念:

复制代码
学习不是终点,工具化才是工程化的开始。

例如:

学习内容 可转化产物
Linear Regression 回归建模调试 prompt
Loss Function loss function selector / debugger
RAG RAG evaluation prompt / retriever skill
Agent Loop ReAct-style agent skill
MCP MCP server template
Safety red-team / guardrail evaluator

这使得学习过程不只是"掌握概念",而是逐步形成自己的 AI 工程工具箱。


4. 覆盖 LLM 全链路:从预训练到生产应用

Phase 10 和 Phase 11 是项目中最适合大模型工程学习者重点关注的部分。

README 中列出的 Phase 10 包括 Tokenizer、数据管线、Mini GPT 预训练、分布式训练、SFT、RLHF、DPO、Constitutional AI、benchmark evaluation、量化、推理优化、完整 LLM pipeline、Speculative Decoding、Sparse Attention、DualPipe、DeepSeek-V3、Jamba、Async / Hogwild inference 等内容。(GitHub)

Phase 11 则进入 LLM Engineering,包括 Prompt Engineering、Few-shot、CoT、Structured Outputs、Embeddings、Context Engineering、RAG、Advanced RAG、LoRA / QLoRA、Function Calling、Evaluation、Caching、Guardrails、Production LLM App、MCP、Prompt Caching 等内容。(GitHub)

这意味着它覆盖了从模型底层到应用系统的完整路线:

复制代码
Tokenizer
→ Pretraining
→ SFT / RLHF / DPO
→ Quantization
→ Inference Optimization
→ RAG
→ Tool Use
→ MCP
→ Production LLM App
→ Guardrails
→ Evaluation

对于想做 LLM 系统、RAG 应用、Agent 工程、模型推理优化的人来说,这部分非常有参考价值。


5. 面向 Agent 与 MCP 的新一代 AI 工程范式

该项目不是停留在传统机器学习课程,而是专门覆盖了 Agent Engineering、Tools & Protocols、Autonomous Systems 和 Multi-Agent & Swarms。

README 中举了一个 Phase 14 的样例:约 120 行纯 Python、无依赖实现一个 agent loop。该 loop 会维护历史消息、调用 LLM、检测 tool calls、执行工具并把结果写回历史,直到返回最终回答或超过步数限制。(GitHub)

这个例子非常关键,因为它揭示了 Agent 系统的本质:

复制代码
LLM 不再只是生成文本
而是在循环中进行推理、调用工具、观察结果、继续执行

这也是当前 Claude Code、Cursor、Codex、OpenDevin、OpenHands 等工具背后的核心范式。


6. 课程质量工程:脚本化检查与 CI 约束

该项目不仅课程规模大,还加入了课程质量检查机制。README 中说明,贡献 lesson 前需要运行:

复制代码
python3 scripts/audit_lessons.py
python3 scripts/audit_lessons.py --phase 14
python3 scripts/audit_lessons.py --json

这些脚本会检查目录结构、docs/en.md、H1 标题、code/ 非空、quiz.json schema、相对链接等规则,规则失败时会返回非零退出码。(GitHub)

此外,2026 年 5 月 20 日的提交记录显示,项目还在持续加入 README counts drift check、strict CI、link check script、lesson_run.py 等工程化检查机制。(GitHub)

这说明项目不是随意堆课程,而是尝试用工程方式维护课程一致性。


四、使用教程

方式一:在线阅读

项目 README 推荐的第一种方式是直接在线阅读。用户可以打开官方网站:

复制代码
aiengineeringfromscratch.com

README 中说明,在线阅读无需克隆仓库,也不需要配置环境,可以直接打开已完成课程或展开某个 phase 查看内容。(GitHub)

适合人群:

复制代码
想先浏览课程体系
不想本地安装环境
希望快速判断是否适合自己

方式二:本地克隆并运行代码

如果希望完整运行课程代码,可以使用 Git 克隆仓库:

复制代码
git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch

README 中给出的示例是运行 Phase 1 中的向量代码:

复制代码
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

该方式适合想真正动手学习的用户。(GitHub)


方式三:使用内置 Agent Skills 找到学习起点

如果你已经在使用 Claude、Cursor、Codex、OpenClaw、Hermes 或支持 SkillKit 的 Agent,可以使用项目内置技能:

复制代码
/find-your-level

README 中说明,这个命令会通过 10 个问题评估你的知识水平,然后映射到适合的起始 phase,并生成带有时间估计的个性化路径。(GitHub)

完成某个 phase 后,可以使用:

复制代码
/check-understanding 3

该命令会对指定 phase 进行 8 题测验,并给出反馈和需要复习的课程。(GitHub)


推荐学习路径

如果你是 AI 初学者,可以按顺序学习:

复制代码
Phase 0 → Phase 1 → Phase 2 → Phase 3 → Phase 7 → Phase 10 → Phase 11

如果你已有机器学习基础,只想做 LLM 工程,可以从:

复制代码
Phase 7 Transformers
Phase 10 LLMs from Scratch
Phase 11 LLM Engineering
Phase 13 Tools & Protocols
Phase 14 Agent Engineering
Phase 17 Infrastructure & Production

如果你关注多模态大模型,可以重点看:

复制代码
Phase 4 Computer Vision
Phase 5 NLP
Phase 6 Speech & Audio
Phase 7 Transformers
Phase 12 Multimodal AI
Phase 19 Capstone Projects

如果你关注 Agent 和工程部署,可以重点看:

复制代码
Phase 11 LLM Engineering
Phase 13 Tools & Protocols
Phase 14 Agent Engineering
Phase 15 Autonomous Systems
Phase 16 Multi-Agent & Swarms
Phase 17 Infrastructure & Production
Phase 18 Ethics & Alignment

五、适合哪些人?

这个项目适合以下几类用户:

用户类型 推荐理由
AI 初学者 有完整阶段路线,不容易碎片化学习
机器学习工程师 可以补齐 LLM、RAG、Agent、MCP、Production 能力
后端 / 全栈工程师 可以从工程角度切入 AI 系统
研究生 / 科研人员 适合系统补充 LLM、Transformer、推理优化和 Agent 工程
AI 产品工程师 可以理解从模型到应用交付的完整链路
想做作品集的人 Phase 19 提供端到端项目方向

六、项目优势与局限

优势

第一,体系完整。它从数学基础一路覆盖到 Agent、MCP、多智能体和生产部署,适合形成系统知识框架。

第二,强调从零实现。每个算法和系统都尽量先手写,再使用生产框架,有助于理解底层原理。

第三,每课都有产出。prompt、skill、agent、MCP server 等 artifact 让学习成果可以进入实际工作流。

第四,工程化程度高。项目包含 roadmap、lesson template、audit script、CI 检查、website 和 glossary,不是简单教程堆叠。

第五,许可证宽松。MIT License 方便个人、教学和团队二次使用。(GitHub)

局限

第一,学习成本较高。项目总时长约 320 小时,不适合只想快速调用 API 的用户。(GitHub)

第二,课程仍在持续建设。虽然很多 phase 已完成,但从 changelog 和 commit 记录看,项目仍在快速更新,需要注意内容变化。(GitHub)

第三,内容覆盖面非常广,学习者需要根据目标裁剪路线,否则容易陷入"什么都学一点"的状态。

第四,部分高级方向,例如 LLM 预训练、分布式训练、推理优化、多智能体和安全对齐,需要较强的工程背景,初学者可能需要额外补充资料。


七、总结

AI Engineering from Scratch 是一个非常值得关注的 AI 工程开源课程项目。它的核心价值不只是"内容多",而是把 AI 学习组织成了一个完整的工程闭环:

复制代码
Learn it:理解概念与数学基础
Build it:从零实现核心算法和系统
Use it:使用生产框架复现
Ship it:产出可复用工具和真实项目

相比普通教程,它更强调:

复制代码
系统性:20 个阶段覆盖 AI 工程主线
实践性:每课都有代码实现
工程性:每课都有 artifact 输出
前沿性:覆盖 LLM、RAG、MCP、Agent、多智能体、安全对齐
可交付性:最终通过 Capstone 项目形成作品集

对于希望从"AI API 使用者"进阶为"AI 工程师"的学习者来说,这个项目的价值很高。它不是让你只会调用模型,而是让你理解模型、构建系统、验证效果,并最终交付可运行的 AI 产品。


八、互动话题

如果你准备用这套项目学习 AI Engineering,你最想优先学习哪个方向?

复制代码
A. 数学基础与机器学习原理
B. Transformer 与 LLM from Scratch
C. RAG、Embedding 与向量数据库
D. Agent Loop 与工具调用
E. MCP Server 与协议工程
F. 多模态 AI:图像、语音、文档理解
G. LLM 推理优化与部署
H. 多智能体与自主系统
I. AI Safety、Alignment 与 Red Team
J. Capstone 项目:做一个真正可交付产品

欢迎在评论区讨论:

你认为未来 AI 工程师最核心的能力,是"会调模型 API",还是"能从底层理解并构建完整 AI 系统"?

相关推荐
甲维斯3 小时前
Gemini3.5Flash前端是真的强!
前端·人工智能
枫叶林FYL4 小时前
【强化学习】3 双系统持续强化学习:快速迁移与元知识整合架构手册
人工智能·机器学习·架构
189228048614 小时前
NY382固态MT29F32T08GSLBHL8-24QM:B
大数据·服务器·人工智能·科技·缓存
AI科技星4 小时前
哥德巴赫猜想1+1基于平行素数对等腰梯形网格拓扑与素数渐近密度的大偶数满填充完备性证明
人工智能·线性代数·架构·概率论·学习方法
GIS数据转换器4 小时前
农村生活污水治理智慧管控平台
大数据·人工智能·分布式·数据分析·生活·智慧城市
常威正在打来福4 小时前
frontend-design 入门指南:OpenClaw / Claude Code / Codex 三平台安装教程
人工智能·ai·ai编程
MediaTea4 小时前
AI 术语通俗词典:Dropout 层
人工智能
武子康4 小时前
调查研究-140 全球机器人产业深度调研报告【02篇】:全球机器人产业格局分析:五个阶段并存与商业化路径 2026
人工智能·ai·机器人·具身智能·智能化
木心术14 小时前
Windows系统下MySQL与AI工具集成方案:数据存储与调用实践
人工智能·windows·mysql