成为 AI Agent 工程师,核心是掌握大模型应用、提示词工程、工具调用、RAG、Agent 框架与多智能体协作,并通过实战落地项目。下面是学习AI Agent的精选书单。
1、《动手做 AI Agent》

7 个实战项目,覆盖办公自动化、智能调度,从原型到落地。
- Agent 1:自动化办公的实现------通过Assistants API和DALL·E3模型创作PPT。
- Agent 2:多功能选择的引擎------通过Function Calling调用函数。
- Agent 3:推理与行动的协同------通过LangChain中的ReAct框架实现自动定价。
- Agent 4:计划和执行的解耦------通过LangChain中的Play-and-Execute实现智能调度库存。
- Agent 5:知识的提取与整合------通过LlamaIndex实现检索增强生成。
- Agent 6:GitHub的网红聚落------AutoGPT、BabyAGI和CAMEL。
- Agent 7:多Agent框架------AutoGen和MetaGPT。
本书适合对Agent技术感兴趣或致力于该领域的研究人员、开发人员、产品经理、企业负责人,以及高等院校相关专业师生等阅读。读者将跟随咖哥和小雪的脚步,踏上饶有趣味的Agent开发之旅,零距离接触GPT-4模型、OpenAI Assistants API、LangChain、LlamaIndex和MetaGPT等尖端技术,见证Agent在办公自动化、智能调度、知识整合以及检索增强生成(RAG)等领域的非凡表现,携手开启人工智能时代的无限可能,在人机协作的星空中共同探寻那颗最闪亮的Agent之星!
2、Agent设计模式

全书主要内容分为上下两篇。
上篇 智能设计的哲学(第1章至第3章)作为全书的思想地基,系统地回答以下核心问题。
- 什么是Agent范式?
- 为何必须构建闭环?
- 模式如何成为心智语言?
- 人与Agent如何共处共生?
可将上篇视为"认知工程学"的实践探索:系统地梳理从面向对象编程到Agent范式的演进逻辑,并从认知科学与控制论中汲取理论支撑,阐明Agent的本体结构与能动性根基。
下篇智能设计模式(第4章至第9章)围绕六大主轴------感知、记忆、推理、行动、反思、协作,构建从个体智能到社会协作的完整闭环。
在下篇中,每章既提供可复用的"工程部件"(即具体、可落地的设计模式),也锚定必要的"思想坐标"(阐释其背后的认知逻辑与系统哲学)。读者既可按需查阅、灵活取用,亦可按顺序阅读,逐步构建完整的Agent设计心智模型。
为便于实践落地,作者提出了5条贯串全书的Agent设计原则。
- 目标优先:一切从"要达成什么"出发,而非先考虑"能调用什么"。
- 上下文为王:Prompt(提示)只是冰山一角,真正决定行为的是上下文工程与记忆治理。
- 显式反馈:将反馈、反思与改进视为核心能力,内建于系统设计之中,而非上线后的补救或"善后"。
- 渐进自治:让系统在安全护栏内逐步提升自治能力,始终保留人类介入的中止权与解释权。对齐与护栏:将伦理、安全与合规要求深度嵌入结构与协议,绝不把风险外包给"运气"或事后干预。
3、AI Agent 开发实战:MCP+A2A+LangGraph 驱动的智能体全流程开发

本书从基础理论到工程实践系统讲解AI Agent的开发,内容涵盖Function Calling、AI智能体设计模式、MCP、RAG、多模态、LangGraph、A2A等主流技术与工具的实战应用,共7章。 第1~3章介绍AI Agent开发需要具备的基础知识,包括AI应用开发快速入门、大模型私有化部署的3种常见方案,以及模型微调与蒸馏的技术原理与实践。第4~7章涵盖4个AI Agent开发项目:基于MCP打造求职助手;基于平台化开发思想构建AI版"作业帮";基于LangGraph打造智能编程助手;基于A2A协议打造多智能体AI金融项目,每章均配有代码示例与实操步骤。 本书既适合希望向AI应用开发领域转型的传统软件工程师阅读,也适合有一定AI开发经验并希望提升实战能力的技术人员阅读。