根据提供的课程转录资料,以下是 CS146S 课程 9 节课的核心内容提取,旨在帮助你系统性地掌握现代软件开发中的 AI 应用:
Wk01: LLM 编程与 AI 开发导论
- 核心概念: 深入解析 LLM 训练的三个阶段:预训练 (海量知识获取)、指令微调 (SFT) (定义性格/对话能力)以及强化学习 (RL/RLHF)(培养逻辑推理与安全意识)。
- 关键技术:
- 思维链 (Chain of Thought):由于模型每生成一个 token 的计算力有限,需要引导它"分步思考"来解决复杂逻辑问题。
- RAG 与工具调用:作为防止幻觉的关键防御手段,将模型从"记忆模式"转为"事实搜索模式"。
- 开发者转型: 工程师的角色从单纯的编写者转变为 "增强型工程师",利用 AI 进行代码重构、性能优化和测试用例生成。
Wk02: 让 LLM 成为自主执行者 (MCP 协议)
- 核心挑战: LLM 的知识是静态的,无法直接感知实时世界(如 API、私有数据)。
- 模型上下文协议 (MCP): 这是一个旨在消除 M*N(多种模型对接多种工具)复杂度的开放标准,将其简化为 M+N 的 "通用适配器"。
- 架构与安全: MCP 采用 JSON RPC 2.0 通讯,支持本地(Stdio)和远程(SSE)传输。安全方面通过 OAuth 2.0 实现权限控制,允许云端智能体安全地访问用户私有资源。
Wk03: AI 集成开发环境 (AI IDE)
- 同步 vs. 异步智能体: 同步工具(如 Copilot)维持开发流;异步智能体(如 Devin)则允许开发者像经理一样并行委托任务,实现 6-12 倍的生产力提升。
- 上下文失败模式: 警惕四种失效:毒化 (错误固定)、分心 (噪声过多)、混淆 (工具过多)和冲突(指令互斥导致的准确率大幅下降)。
- 核心哲学: "规格说明 (Spec) 即源代码"。生成的代码只是 Spec 的"有损投影",开发者应专注于精确的架构设计与文档描述。
Wk04: 编程智能体模式 (Coding Agent Patterns)
- 智能体管理器: 开发者从 Coders 转型为 Agent Managers ,核心技能变为 "上下文工程"。
- 项目规则治理: 利用
CLAUDE.md(或类似文件)为仓库定义特定的编码规范、构建流程和工具说明,使智能体能够自主运行且不破坏系统。 - 实战模式: 推荐 TDD(测试驱动开发) 模式,先让智能体写测试并确认失败,再生成代码,这能极大提高结果的可靠性。
Wk05: 现代 AI 终端 (Modern AI Terminal)
- 产品原则: 优秀工具应具备"从熟悉界面开始"、"零配置摩擦"、"自然语言作为一等公民"等原则。
- 智能体配置文件: 区分 "战略型 (Strategic)" (侧重推理、安全、需确认)与 "YOLO"型(侧重速度、全自动、适合原型开发)智能体。
- Vibe Coding(氛围编程): 在原型阶段牺牲一定的结构化来追求极速反馈,但需通过
warp.md等上下文文件维持长期质量。
Wk06: AI 测试与安全
- 新型威胁: 智能体可能面临 RCE(远程代码执行) 、工具误用和 "YOLO 模式"提权(攻击者通过注入指令让 AI 自动关闭安全确认)。
- 上下文腐烂 (Context Rot): 随着输入变长,LLM 的性能并非线性分布,即使是简单的重复任务也会失效。
- 防御策略: 必须实施 防御性沙盒 (Sandboxing)、输入清理(预防 Base64 绕过)以及严格的 XML/JSON 指令隔离。
Wk07: 现代软件支持 (AI 代码审查)
- 审查层次结构: 代码审查的基础是 "精神对齐 (Mental Alignment)",即知识传递,而非仅仅是找 Bug。
- 黄金地带 (Gold Zone): AI 最擅长发现性能问题、安全漏洞和文档缺失,而人类应保留对架构决策和业务逻辑的最终发言权。
- 可执行性 (Actionability): 借鉴 Google 的经验,AI 的反馈率应以开发者是否真正修改代码为衡量指标(约 50% 以上即为有效)。
Wk08: 自动化 UI 与应用构建
- 端到端流程: 从"自然语言输入"到"即时部署",AI 正消除基础设施配置的"经济税"。
- 可靠性工程: 尖端工具(如 V0)使用 "流操纵 (Stream Manipulation)" 实时拦截并修复模型生成的框架错误(如错误的库引入),从而保证生成代码 93% 以上的无错率。
- 价值位移: 瓶颈已从"编写组件"移向"验证想法"和"策略设计"。
Wk09: 部署后的智能体管理 (Post-Deployment)
- SRE 革命: 引入 "故障预算 (Error Budget)" 和 "苦力活限额 (Toil Threshold)"。如果代码太不稳定导致运维负担过重,工作量将自动推回给开发团队。
- AI 原生运维: 演进到 AI 生产工程师 阶段。由多个专家智能体(数据库专家、网络专家等)并行分析 Trace (追踪) 和 Span (跨度),在 1 分钟内定位故障根源并生成实时操作手册。
这些提取的内容涵盖了从底层模型训练到高层运维管理的全生命周期。建议你在学习时,重点关注 "上下文工程" 和 "智能体工作流设计",这是区别于传统开发者的核心竞争力。