快手NLP面试题：Agent开发框架

题目

Agent开发有哪些框架？在你的**项目中为什么采用LangChain/LangGraph框架开发？

解答

（1）Agent开发有哪些框架？

a.编程框架：代码优先，掌控全局

如果追求最大的灵活性和对流程的精确控制，这类框架是主力。

LangGraph ：如果说 LangChain 是瑞士军刀，那 LangGraph 就是这把这把刀的智能组装车间。它的核心思想是把智能体的工作流定义成一个有状态的图（Graph） ，可以用节点（Node）和边（Edge）精确控制每一个步骤，比如条件分支、循环、并行执行等。它特别适合构建复杂的、多步骤的、需要持久化状态的系统。LangGraph 现在已成为 LangChain 生态的底层执行引擎，稳定性和成熟度都非常高。
Semantic Kernel (SK) ：这是微软推出的框架，它的设计哲学与 LangChain 截然不同。SK 将自己定位为一个 AI 中间件 ，核心是一个叫 Kernel 的容器，用来管理所有的 AI 服务、插件（Plugins）和记忆。只需要用 @kernel_function 这样的装饰器把功能"装饰"一下，剩下的调用和编排逻辑主要由模型自主决定。如果需要在 .NET 生态或与微软技术栈深度集成，或者对 MCP 等开放协议有强需求（SK v1.28.1 已原生支持 MCP），SK 是绝佳选择。
AutoGen (AG2) ：由微软研究院推出的 AutoGen，主打的是多智能体对话 。它允许定义多个可以相互"聊天"的智能体，通过对话协作来解决复杂问题。它的场景非常自然，比如一个写代码的智能体、一个测试代码的智能体和一个充当产品经理的人类代理，他们可以围坐一桌，通过讨论把任务搞定。AutoGen 在需要来回辩论、迭代式改进的任务（如编码助手、市场调研）中表现惊艳。
CrewAI：这个框架的构思很巧妙，它引入了"角色扮演"的概念。可以像导演一样，为每个智能体分配角色、目标和背景故事，然后由 CrewAI 来协调他们像一个团队一样工作。如果任务可以被清晰地分解成不同专家协作完成的流程（例如：一个研究员负责收集资料，一个分析师负责撰写报告，一个校对员负责润色），CrewAI 能让代码结构清晰，非常直观。
LlamaIndex ：它是数据世界与 LLM 世界之间的那座桥。LlamaIndex 的核心是提供了一套极其强大的工具，用于摄取、索引和查询各种异构数据（如 PDF、数据库、API 等），并构建高级检索增强生成（RAG）系统。如果智能体核心任务是与企业私域知识进行深度交互，LlamaIndex 可以提供比 LangChain 更专精、更高效的数据处理能力。
Eino ：这是一个由 CloudWeGo 开源的、基于 Go 语言的 LLM 应用开发框架。对于主要在 Go 技术栈中进行云原生开发的团队来说，Eino 的出现解决了长久以来 Go 语言在 AI Agent 开发领域框架缺失的痛点。它同样提供了图编排、智能体开发套件（ADK）等完整能力，性能出色，非常适合对性能有极致要求、需要与现有 Go 微服务体系无缝集成的场景。

b.低代码/平台化：开箱即用，快速验证

当需要快速验证想法，或者让业务人员也能参与到智能体的构建中来时，这类平台会是很好的起点。

Dify ：这是一个很受欢迎的开源 LLMOps 平台，可以把它理解为一个 AI 应用的可视化 IDE。可以通过拖拽的方式，轻松编排提示词、知识库、工具和工作流，几分钟内就能构建出一个可用的智能体，并直接发布为 API 应用。Dify 的核心价值在于 "低门槛"和"高效率"，非常适合团队快速进行原型验证，或者交付一些标准化的 AI 应用（如客服机器人、内容生成工具）。
Coze （扣子）：由字节跳动推出的智能体平台，它的特点是对普通用户极其友好，几乎是零代码，通过点选和配置就能创建一个功能强大的智能体。它内置了海量的插件（如搜索、新闻、阅读等），并一键发布到飞书、微信等主流平台。对于希望快速拥有一个能用的智能体、并部署到社交平台的个人或团队，Coze 是个很高效的选择。

c.专业引擎/协议层：专攻一点，做到极致

这类工具专注于解决智能体开发中的某个核心难题，可以作为其他框架的强力补充。

HayStack ：这是一个专注于企业级搜索和RAG的框架。它提供了非常严谨的组件和管道设计，并在安全性上做得很到位，包括细粒度的访问控制、审计日志和数据脱敏等。对于金融、医疗等对数据安全和合规性要求极高的行业，HayStack 会是一个比通用框架更稳妥的选择。
RagFlow ：这是一个专注于解决 RAG（检索增强生成） 核心痛点的引擎。它的核心理念是"深度文档理解"，能通过模板化解析，智能识别 PDF、Word 等文档中的标题、段落、表格，实现"所见即所得"的精准文本切块，从而大幅提升知识库问答的准确率。如果需要为 RAG 应用中知识切片的准确性和召回率而头疼，RagFlow 值得认真研究。

如何选择？一张简单的选型建议表

如果任务的核心需求是...	可以重点考虑...	原因
复杂的流程控制（如分支、循环、持久化）	LangGraph	它本身就是为有状态、复杂的图流程而设计的。
多智能体协作（如编码助手、辩论式任务）	AutoGen 或 CrewAI	AutoGen 胜在对话驱动，CrewAI 胜在角色分工明确。
构建高性能的RAG系统（处理大量文档）	LlamaIndex 或 RagFlow	LlamaIndex 是数据检索的集大成者，RagFlow 则在文档解析上做到极致。
深度集成现有技术栈（如 Go/ .NET 生态）	Eino 或 Semantic Kernel	它们与各自的语言生态（Go/ .NET）完美融合，能最大化复用现有代码。
快速验证原型或交付标准化应用	Dify 或 Coze	可视化编排，开箱即用，开发效率最高，无需从零写代码。
对企业级安全有极致要求	HayStack	它在安全和审计方面提供了框架级的原生支持。

（2）LangChain/LangGraph框架有哪些优势？

简单来说，LangChain 提供了构建智能体的基础乐高积木，而 LangGraph 则提供了搭建复杂、可控、可靠的智能体工厂的能力。

LangChain：智能体开发的基石

LangChain 是更早出现的框架，它为智能体开发提供了标准化的组件和接口，优势在于：

丰富的组件库与抽象
- 模型（Models）：提供了统一的接口来调用上百种不同的语言模型，如 OpenAI、Anthropic、Google Gemini 等。你可以轻松切换模型，而不需要重写大量代码。
- 提示词模板（Prompts）：帮助你管理和复用复杂的提示词，特别是针对少样本学习、指令格式化等场景。
- 记忆（Memory） ：为智能体提供了短期和长期记忆的能力。你可以方便地使用 ConversationBufferMemory、ConversationSummaryMemory 等来管理对话历史，让智能体能够记住上下文。
- 检索（Retrieval）：强大的文档加载、分割、向量化和检索工具，是构建检索增强生成（RAG）应用的基础，让智能体能访问外部知识库。
- 工具（Tools）：将任何 Python 函数、API 或现有服务包装成一个"工具"，让智能体可以去调用。这使得智能体具备了执行动作的能力，比如搜索网页、计算数学题、调用公司内部 API 等。
开箱即用的智能体架构： LangChain 内置了多种经典的智能体类型，如 OpenAI Tools Agent、ReAct Agent 等。你可以用几行代码就快速搭建起一个能思考、能调用工具的智能体原型，极大地缩短了概念验证的时间。

LangGraph：进阶智能体的核心引擎

LangChain 在处理线性工作流时很出色，但当智能体的逻辑变得复杂（如循环、分支、人机交互）时，其原有的 Chain 模型就力不从心了。LangGraph 正是为了解决这个问题而诞生的。它的优势更具革命性：

用图来构建复杂、可控的循环逻辑
- 核心优势 ：LangGraph 将智能体的运行逻辑建模为一个有状态图。节点（Nodes）是智能体的动作或函数（如"调用 LLM"、"调用工具"），边（Edges）是决定下一步走向的逻辑路由。
- 突破性 ：这使得你可以构建循环。一个真正的智能体往往需要思考-行动-观察的循环，LangGraph 原生支持这种模式。例如，智能体可以反复调用工具，直到收集到足够信息再给出最终答案，整个过程完全可控。
内置持久化与人工介入
- 持久化：LangGraph 为每个图执行都维护一个状态，并且可以自动将中间状态保存到数据库中。这意味着你可以随时暂停和恢复一个长时间运行的智能体任务，比如一个需要几天审批的多步骤工作流。
- 人机交互：你可以在图的任何节点设置断点，让执行过程停下来，等待人工输入。这在需要人工审核、确认或提供额外信息的场景下非常有用。例如，一个生成营销邮件的智能体，可以在发送前停下来，让人类检查并修改内容。
**细粒度的流程控制：**与 LangChain 智能体的"黑盒"循环不同，LangGraph 让你明确定义智能体的每一步。你可以清晰地看到"在什么情况下，智能体应该去调用工具 A，而不是工具 B；如果工具调用失败，是重试还是向用户道歉"。这种精细的控制力对于构建稳定、可靠的智能体至关重要。

总结：LangChain/LangGraph 组合的优势

维度	LangChain 的优势	LangGraph 的优势
开发阶段	快速启动和原型设计。提供现成组件，让开发者能迅速拼凑出一个可用的智能体。	深度优化和复杂部署。当智能体逻辑变得复杂，需要精细控制、循环和状态管理时，LangGraph 是更优选择。
核心能力	丰富的工具集成。通过工具（Tools）生态，让智能体能够连接世界。	复杂的流程编排。通过有状态图，实现高度定制化、可预测的智能体行为。
处理逻辑	适用于线性或简单分支的流程。	天生支持复杂的循环、分支、并行动作和人机交互。
最终价值	降低入门门槛，让更多人能尝试和构建智能体应用。	提升应用上限，让开发者能构建出可用于生产环境、稳定可靠、逻辑严谨的智能体系统。

总而言之，LangChain 为你提供了构建智能体所需的所有"零件"，而 LangGraph 则为你提供了一张可以设计出任何复杂智能体行为的"蓝图"和相应的"施工工具"。两者结合，开发者可以构建从最简单的聊天机器人到最复杂的、能自主决策和长期运行的多智能体系统，兼顾了开发的便捷性和最终系统的可靠性。