怎么成为一个 AI Agent 工程师？

成为 AI Agent 工程师，核心是掌握大模型应用、提示词工程、工具调用、RAG、Agent 框架与多智能体协作，并通过实战落地项目。下面是学习AI Agent的精选书单。

1、《动手做 AI Agent》

7 个实战项目，覆盖办公自动化、智能调度，从原型到落地。

Agent 1：自动化办公的实现------通过Assistants API和DALL·E3模型创作PPT。
Agent 2:多功能选择的引擎------通过Function Calling调用函数。
Agent 3:推理与行动的协同------通过LangChain中的ReAct框架实现自动定价。
Agent 4:计划和执行的解耦------通过LangChain中的Play-and-Execute实现智能调度库存。
Agent 5:知识的提取与整合------通过LlamaIndex实现检索增强生成。
Agent 6：GitHub的网红聚落------AutoGPT、BabyAGI和CAMEL。
Agent 7:多Agent框架------AutoGen和MetaGPT。

本书适合对Agent技术感兴趣或致力于该领域的研究人员、开发人员、产品经理、企业负责人，以及高等院校相关专业师生等阅读。读者将跟随咖哥和小雪的脚步，踏上饶有趣味的Agent开发之旅，零距离接触GPT-4模型、OpenAI Assistants API、LangChain、LlamaIndex和MetaGPT等尖端技术，见证Agent在办公自动化、智能调度、知识整合以及检索增强生成（RAG）等领域的非凡表现，携手开启人工智能时代的无限可能，在人机协作的星空中共同探寻那颗最闪亮的Agent之星！

2、Agent设计模式

全书主要内容分为上下两篇。

上篇智能设计的哲学（第1章至第3章）作为全书的思想地基，系统地回答以下核心问题。

什么是Agent范式?
为何必须构建闭环？
模式如何成为心智语言？
人与Agent如何共处共生?

可将上篇视为"认知工程学"的实践探索：系统地梳理从面向对象编程到Agent范式的演进逻辑，并从认知科学与控制论中汲取理论支撑，阐明Agent的本体结构与能动性根基。

下篇智能设计模式（第4章至第9章）围绕六大主轴------感知、记忆、推理、行动、反思、协作，构建从个体智能到社会协作的完整闭环。

在下篇中，每章既提供可复用的"工程部件"（即具体、可落地的设计模式），也锚定必要的"思想坐标"（阐释其背后的认知逻辑与系统哲学）。读者既可按需查阅、灵活取用，亦可按顺序阅读，逐步构建完整的Agent设计心智模型。

为便于实践落地，作者提出了5条贯串全书的Agent设计原则。

目标优先：一切从"要达成什么"出发，而非先考虑"能调用什么"。
上下文为王：Prompt(提示）只是冰山一角，真正决定行为的是上下文工程与记忆治理。
显式反馈：将反馈、反思与改进视为核心能力，内建于系统设计之中，而非上线后的补救或"善后"。
渐进自治：让系统在安全护栏内逐步提升自治能力，始终保留人类介入的中止权与解释权。对齐与护栏：将伦理、安全与合规要求深度嵌入结构与协议，绝不把风险外包给"运气"或事后干预。

3、AI Agent 开发实战：MCP+A2A+LangGraph 驱动的智能体全流程开发

本书从基础理论到工程实践系统讲解AI Agent的开发，内容涵盖Function Calling、AI智能体设计模式、MCP、RAG、多模态、LangGraph、A2A等主流技术与工具的实战应用，共7章。第1～3章介绍AI Agent开发需要具备的基础知识，包括AI应用开发快速入门、大模型私有化部署的3种常见方案，以及模型微调与蒸馏的技术原理与实践。第4～7章涵盖4个AI Agent开发项目：基于MCP打造求职助手；基于平台化开发思想构建AI版"作业帮"；基于LangGraph打造智能编程助手；基于A2A协议打造多智能体AI金融项目，每章均配有代码示例与实操步骤。本书既适合希望向AI应用开发领域转型的传统软件工程师阅读，也适合有一定AI开发经验并希望提升实战能力的技术人员阅读。