
"如今最难的,不是做出一个 AI Agent,而是知道何时该放弃某个组件、换条路走。"------ 吴恩达
过去几年,AI 工具日新月异,开发者们拥有越来越多的乐高积木:LangGraph、RAG、MCP......模块日益丰富,系统构建似乎越来越容易。但现实是,在构建真正可用的 AI 系统时,大多数团队依然卡在任务分解、流程编排、上下文管理或评估等细节上。
就在不久前,吴恩达 与 LangChain 联合创始人 Harrison Chase 展开了一场深度对话,围绕 Agent 构建的认知误区、开发者常踩的坑、模块化工具的选择,以及新兴语音技术的未来潜力,分享了诸多极具价值的观察和建议。本文为这场对话的精选内容整理与编译。
一、别再纠结"是不是 Agent",重点在于"多 Agentic"
吴恩达提出一个新视角:与其争论某个系统是否是 Agent,不如看它有多少"Agenticness(代理性)"。
在他看来,Agent 并不是一个非黑即白的分类,而是一个连续谱系。比如,一个自动填表或做检索工作的系统,也具有一定程度的自主性,就可以视为一种"Agentic System"。

而真正重要的,是如何构建这些系统------尤其是:
- 任务如何拆分?
- 流程如何编排?
- 如何快速发现系统失效的步骤?
- 每一步该如何评估?
吴恩达指出,这些"流程拆解 + 构建 + 评估"的技能,目前仍然非常稀缺。
现实中的 AI 项目往往卡在这些问题上,而不是卡在大模型本身。
二、Agentic 系统落地最大挑战:流程分解与评估机制
在企业场景中,许多业务流程非常线性:比如填写表单、进行合规查询、数据搬运。这些流程初看简单,实际构建时却面临多个难点:
- 拆解粒度不合适,流程无法执行;
- 没有系统性评估机制,问题难以定位;
- 缺乏"什么时候放弃某方案"的判断力。
许多团队花数月优化一个做不好的组件,结果徒劳无功。而经验丰富的开发者,能迅速换路,跳出死胡同。

"构建 Agent 的关键,不在于 LLM 有多强,而在于你能否构建出良好的任务结构和评估体系。"------ 吴恩达
三、工具越来越多,AI 开发反而越来越"残酷"
很多人以为有了 LangGraph、RAG、Guardrails 等工具,构建系统会更简单。但吴恩达指出:工具多了,组合变难了,选择也变多了,开发反而更"残酷"。

他将这些工具比作"不同形状颜色的乐高积木":
有经验者知道哪块适合当前任务,能迅速搭出稳定原型;
- LangGraph 构建控制流
- RAG 优化信息检索
- MCP 简化系统集成与数据访问
- Eval 体系快速定位瓶颈
- Guardrails 限制模型越界行为
没经验者容易"拿错积木",走进冗长迂回的技术误区。
但问题在于,工具更新太快,最佳实践更新更快。
以 RAG 为例,过去需要大量调参、迭代 Prompt;如今上下文长度提升,参数变"宽容"了。但这也意味着过去的直觉失效,开发者需要持续更新自己的工具认知。
四、评估系统:最快见效却最常被忽视的积木
"大多数团队还没真正上手做系统评估。"
在吴恩达看来,评估并不是一个复杂系统,完全可以快速搭建、快速受益。例如:
- 用几个样例和简单 LLM 就能做小范围评估;
- 初版评估系统再差,也能作为人工 Eyeball 的补充;
- 有了初版,后续才能逐步迭代。

"就像写论文,先写出来一个'差评估',才知道怎么变好。"------ 吴恩达
这一理念也适用于团队文化建设:构建 AI 系统时,不应等"完美评估"再开始,而应尽早嵌入"小而简"的评估逻辑。
五、被低估的模块:语音栈与 AI 编程协作
除了流程与评估,吴恩达还特别强调了两个被低估的重要方向:
1. 语音技术栈(Voice Stack)
很多开发者以为语音只涉及 Speech-to-Text,但他更看重的是可控的语音 Agentic 工作流。这类系统不仅限于实时语音 API,而是能将语音作为自然交互的一部分,融入多步骤任务中。
"我们看到一些大型企业对语音 Agent 的需求极其迫切。"
2. AI 辅助编程与企业文化
尽管 AI 编程工具显著提升了开发效率,但很多企业仍然禁止使用。这种限制在吴恩达看来,极大限制了技术团队的潜能释放。
他提到,自己所在的 AI Fund,"连前台和 CFO 都写代码",鼓励所有成员具备基本编程能力,从而更好理解 AI 系统本质与工作流程。
六、MCP 与工具集成的下一个突破口
尽管 MCP(Model-Computing-Platform)概念为集成工具、数据源、API 提供了良好架构,但目前仍处于"蛮荒阶段"。
- 许多开源实现跑不通
- 身份验证、Token 管理仍不成熟
- DevOps 经验不足导致部署困难

但吴恩达依然看好这个方向,认为MCP 能成为统一 AI 工作流的底座平台,关键是经验与实践不断沉淀。
写在最后:你要构建的,不是 Agent,而是判断力
吴恩达总结道:
"我们不能再靠模糊的直觉做判断,真正有经验的人,是看 Trace、看评估,几分钟内判断哪块坏了、该怎么换。"
真正掌握 Agent 构建核心的人,不是掌握某个"工具",而是拥有一套"看图纸、选材料、识风险、懂组合"的判断逻辑。
未来两年,谁能率先构建出从任务拆解、流程集成、评估优化到协同通信的完整 Agentic 流程,谁就能在这场 AI 系统工程战中取得先机。
📌 延伸阅读:
👀 你怎么看 Agentic 架构的落地挑战?欢迎留言交流你的经验与疑问。