在之前几篇文章中,Chaiys同学设计了一个高考信息查询智能助手AI Agent业务场景,分别使用手写代码、LangChain框架、QwenAgent框架、AgentScope框架实现了一次,学习了几大框架如何开发智能体。
在此基础上,我们进一步对比它们在业务逻辑编排、大模型调用、工具调用、上下文记忆、多智能体协作等方面的差异,看看框架是否确实能方便我们进行智能体开发。
业务逻辑编排对比
首先回顾一下我们的业务流程:

接下来分别使用手写代码和几种框架来实现这个业务流程逻辑,看看差异所在。
1、手写代码
纯编码时,我们直接根据业务逻辑来串联工作流:
python
# sql agent
def sql_agent(user_query):
# 1. 语义匹配
table = semanticService.hybrid_search(user_query, 1)
if not table:
print(f"未匹配到字段")
return Result.error()
table_struct = [t["table_info"] for t in table]
prompt = f"""
你是一个MySQL专家。根据以下表结构信息:
{table_struct}
历史问答(仅供参考):"{mm.get_messages(session_id)}"
用户查询:"{user_query}"
生成标准MYSQL查询语句。
要求:
1. 只输出MYSQL语句,不要额外解释
2. 根据语义和字段类型,使用COUNT/SUM/AVG等聚合函数进行计算,非必须
3. 给生成的字段取一个简短的中文名称
输出格式:使用[]包含sql文本即可,不需要其他输出,便于解析,例如:[select 1 from dual]
"""
print(f"SQL AGENT PROMPT={prompt}")
# 2. 大模型生成SQL
str1 = analysisService.analysis(prompt)
sql = re.search(r'[(.*?)]', str1, re.DOTALL).group(1).strip()
# 3. 执行查询
if not sql:
print("\nSQL生成失败")
return Result.error()
resultSet = queryService.query_with_column(sql)
if not resultSet:
print("\nSQL查询失败")
return Result.error()
return Result.success(data={ "tableStruct": table_struct, "resultSet": resultSet, "sql": sql })
# analysis agent
def analysis_agent(user_query, data):
# 基础分析
prompt = f"""
根据以下表结构信息:
{data['tableStruct']}
查询SQL:
{data['sql']}
和以下数据信息:
{data['resultSet']}
历史问答(仅供参考):"{mm.get_messages(session_id)}"
用户查询:"{user_query}"
生成一段简要分析,加上一些预测总结的内容
"""
print(f"ANALYSIS AGENT PROMPT={prompt}")
return Result.success(analysisService.analysis(prompt))
def workflow(user_input):
# 1 - SQL Agent
result = sql_agent(user_input)
if not result.success:
returnNone
# 2 - Analysis Agent
return analysis_agent(user_input, result.data)
2、LangChain框架
使用LangChain框架的Chain模式时,可以手动串联业务流程逻辑:
ini
# 构建顺序链
overall_chain = SequentialChain(
chains=[
TransformChain(
input_variables=["user_query"],
output_variables=["table_schema"],
transform=get_table_schema
),
TransformChain(
input_variables=["user_query", "table_schema"],
output_variables=["sql_result", "generated_sql"],
transform=execute_sql
),
analysis_chain
],
input_variables=["user_query"],
output_variables=["analysis_result"],
verbose=True
)
LangChain 已经发展出丰富的 Chain 类型,用于构建复杂、模块化的 LLM 应用,这里就不一一介绍了。
LangChain框架除了提供Chain模式外,还可以使用的Agent模式来实现,通过提示词来指定业务流程逻辑,然后直接调用工具,如下:
ini
# 初始化Agent
agent = initialize_agent(
tools=[semantic_tool, sql_tool],
llm=llm,
agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION,
verbose=True,
handle_parsing_errors=True,
max_iterations=10, # 增加最大迭代次数以支持多步查询
early_stopping_method="generate"
)
def chat(user_query):
print("执行方法chat")
# 更明确的指令
enhanced_query = f"""
问题:{user_query}
请特别注意:这个问题可能需要从多个表中查询数据。
1. 首先确定需要查询哪些数据
2. 使用match_metadata工具分别匹配包含这些数据的表结构
3. 对每个表生成相应的SQL查询语句
4. 执行查询并汇总结果
5. 最后计算并给出答案
请确保逐步执行,不要跳过任何步骤。
"""
try:
result = agent.run(enhanced_query)
print(f"\n最终结果: {result}")
except Exception as e:
print(f"执行过程中出错: {str(e)}")
# 这里可以添加重试或更详细的错误处理逻辑
3、QwenAgent框架
QwenAgent框架则只能通过提示词方式指定业务流程逻辑,然后直接调用Assistant等待用户输入:
ini
# 创建Agent实例
agent = Assistant(
name='ai_agent_assistant',
llm={
'model': 'qwen3:32b',
'model_server': 'http://localhost:11434/v1',
},
system_message="""
你是一个数据分析助手,负责帮助用户查询数据库信息。
请特别注意:用户的问题可能需要从多个表中查询数据。
1. 首先确定需要查询哪些数据
2. 使用match_metadata工具分别匹配包含这些数据的表结构
3. 对每个表生成相应的SQL查询语句
4. 执行查询并汇总结果
5. 最后计算并给出答案
请确保逐步执行,不要跳过任何步骤。
""",
function_list=[MatchMetadataTool(), ExecuteSQLTool()],
)
4、AgentScope框架
AgentScope框架中支持单体Agent模式,将工具提供给框架,再通过提示词来指定业务流程逻辑:
ini
async def interactive_react_agent() -> None:
"""创建一个支持多轮对话的ReAct智能体。"""
# 准备工具
toolkit = Toolkit()
toolkit.register_tool_function(match_metadata)
toolkit.register_tool_function(execute_sql)
jarvis = ReActAgent(
name="Jarvis",
sys_prompt="""
你是一个数据分析助手,负责帮助用户查询数据库信息。
请特别注意:用户的问题可能需要从多个表中查询数据。
1. 首先确定需要查询哪些数据
2. 使用match_metadata工具分别匹配包含这些数据的表结构
3. 对每个表生成相应的SQL查询语句
4. 执行查询并汇总结果
5. 最后计算并给出答案
请确保逐步执行,不要跳过任何步骤。
""",
model=OllamaChatModel(
model_name="qwen3:32b", # 指定模型名称
stream=True, # 根据需要设置是否流式输出
enable_thinking=True, # 为Qwen3启用思考功能(可选)
# host="http://localhost:11434" # 如果Ollama不在默认地址,需指定
),
formatter=OllamaChatFormatter(),
toolkit=toolkit,
memory=InMemoryMemory(),
)
小结
手写代码需人工串联各个步骤,灵活但开发成本高,维护复杂。各框架则提供了丰富的链(Chain)或Agent模式,支持流程模块化、工具调用自动化,极大提升开发效率和可维护性。
模型调用对比
接下来看看手写代码和使用开发框架,都是如何调用大模型的,如何处理大模型的流式输出的。
1、手写代码
通过HTTP方式调用外部大模型示例:
python
import requests
# Analysis API
class AnalysisService:
def __init__(self):
self.ollama_host = "http://localhost:11434/api/chat"
def analysis(self, prompt, model="deepseek-r1:32b", messages=None):
# 发送POST请求
if messages isNone:
messages = []
str = ""
newMessages = messages[:]
newMessages.append({"role": "user", "content": prompt})
# 请求数据
data = {
"model": model,
"messages": newMessages,
"stream": True
}
isThinking = False
with requests.post(self.ollama_host, json=data, stream=True) as response:
# 处理流式响应
for line in response.iter_lines():
if line:
decoded_line = line.decode('utf-8')
try:
# 解析JSON数据
chunk = json.loads(decoded_line)
content = chunk['message']['content']
if "<think>"in content:
isThinking = True
if "</think>"in content:
isThinking = False
if not isThinking and"</think>"notin content:
str += chunk['message']['content']
# 打印消息内容
print(chunk['message']['content'], end='', flush=True)
except json.JSONDecodeError:
print(f"无法解析JSON: {decoded_line}")
return str
使用官方或社区封装的 Python 包(如 ollama 包)调用示例:
ini
import ollama
# 调用模型生成回复,流式输出
for chunk in ollama.chat(
model='deepseek-r1:32b',
messages=[{'role': 'user', 'content': '讲一个笑话'}],
stream=True
):
print(chunk['message']['content'], end='', flush=True)
2、LangChain框架
LangChain内部集成支持多种类型的模型调用,以下列举部分:
| 模型类型 | 支持模型示例 | 示例代码 |
|---|---|---|
| GGUF 格式(Llama.cpp) | Llama 3, Mistral, Phi-3, Gemma 等 | python from langchain_community.llms import LlamaCpp llm = LlamaCpp(model_path="/path/to/model.gguf", n_ctx=2048) |
| Transformers (PyTorch) | Llama 3, Qwen, GLM, Mistral, Falcon 等 | python from langchain_community.llms import HuggingFacePipeline pipe = pipeline("text-generation", model="Qwen/Qwen2-7B-Instruct") llm = HuggingFacePipeline(pipeline=pipe) |
| vLLM (高性能推理) | 支持所有 Transformers 模型 | python from langchain_community.llms import VLLM llm = VLLM(model="Qwen/Qwen2-7B-Instruct", tensor_parallel_size=1) |
| Ollama | llama3, mistral, phi3, qwen2, gemma 等 | python from langchain_ollama import OllamaLLM llm = OllamaLLM(model="llama3") |
| Local LLM via API | 任意本地模型 | python from langchain_openai import ChatOpenAI llm = ChatOpenAI( base_url="<http://localhost:1234/v1>", api_key="not-needed", model="local-model" ) |
3、QwenAgent框架
QwenAgent内部集成支持通用HTTP方式调用大模型:
ini
...
# 创建Agent实例
agent = Assistant(
name='ai_agent_assistant',
llm={
'model': 'qwen3:32b',
'model_server': 'http://localhost:11434/v1',
},
...
4、AgentScope框架
AgentScope内部集成多模型支持:
| 模型平台 | 类名 | 说明 |
|---|---|---|
| Ollama | OllamaChatModel |
调用本地 Ollama 服务,支持 qwen3:32b 等模型,支持 enable_thinking=True |
| 阿里云 DashScope(Qwen) | DashScopeChatModel |
调用 Qwen 系列 API(qwen-max/plus/turbo/vl),支持 enable_thinking(Qwen3/QwQ/DeepSeek-R1) |
| OpenAI | OpenAIChatModel |
调用 GPT 系列(gpt-4o、gpt-3.5-turbo 等),支持 reasoning_effort(o3/o4) |
| Anthropic | AnthropicChatModel |
调用 Claude 系列(opus/sonnet/haiku),支持 thinking 配置 |
| Google Gemini | GeminiChatModel |
调用 Gemini 1.5/2.0 系列,支持 thinking_config(如 include_thoughts=True) |
小结
手写代码通常直接调用HTTP接口或使用官方SDK,需自行处理流式输出的循环响应和异常。而几种开发框架都内置对多种模型的统一封装,只要简单配置即可,简化了调用过程,提升了稳定性和扩展性。
工具调用对比
现在AI Agent中调用工具Tools已经是典型场景了,所以接下来对这块做个对比分析。
1、手写代码
需要手动调用外部工具:
python
...
# sql agent
def sql_agent(user_query):
# 1. 语义匹配
table = semanticService.hybrid_search(user_query, 1)
...
# 3. 执行查询
if not sql:
print("\nSQL生成失败")
return Result.error()
resultSet = queryService.query_with_column(sql)
...
2、LangChain框架
Agent模式初始化传入tools即可:
ini
# 初始化Agent
agent = initialize_agent(
tools=[semantic_tool, sql_tool],
llm=llm,
agent=AgentType.CONVERSATIONAL_REACT_DESCRIPTION,
verbose=True,
handle_parsing_errors=True,
max_iterations=10, # 增加最大迭代次数以支持多步查询
early_stopping_method="generate",
memory=memory
)
3、QwenAgent框架
Agent模式初始化传入tools即可:
ini
# 创建Agent实例
agent = Assistant(
name='ai_agent_assistant',
llm={
'model': 'qwen3:32b',
'model_server': 'http://localhost:11434/v1',
},
system_message="""
你是一个数据分析助手,负责帮助用户查询数据库信息。
请特别注意:用户的问题可能需要从多个表中查询数据。
1. 首先确定需要查询哪些数据
2. 使用match_metadata工具分别匹配包含这些数据的表结构
3. 对每个表生成相应的SQL查询语句
4. 执行查询并汇总结果
5. 最后计算并给出答案
请确保逐步执行,不要跳过任何步骤。
""",
function_list=[MatchMetadataTool(), ExecuteSQLTool()],
)
需要处理一下流式输出结果,获取文本内容:
ini
def read_steam_response(response_generator):
# 处理生成器响应
full_response = ''
start = 0
end = 0
for response in response_generator:
# 检查响应类型并适当处理
if isinstance(response, list):
# 如果是列表,提取内容
for item in response:
if isinstance(item, dict) and'content'in item:
full_response = item['content']
end = full_response.__len__()
elif isinstance(item, str):
full_response = item
end = full_response.__len__()
elif isinstance(response, dict) and'content'in response:
full_response = response['content']
end = full_response.__len__()
elif isinstance(response, str):
full_response = response
end = full_response.__len__()
print(f"{full_response[start:end]}", end="")
start = end
return full_response
4、AgentScope框架
Agent模式初始化传入tools即可:
ini
# 准备工具
toolkit = Toolkit()
toolkit.register_tool_function(match_metadata)
toolkit.register_tool_function(execute_sql)
jarvis = ReActAgent(
name="Jarvis",
sys_prompt="""
你是一个数据分析助手,负责帮助用户查询数据库信息。
请特别注意:用户的问题可能需要从多个表中查询数据。
1. 首先确定需要查询哪些数据
2. 使用match_metadata工具分别匹配包含这些数据的表结构
3. 对每个表生成相应的SQL查询语句
4. 执行查询并汇总结果
5. 最后计算并给出答案
请确保逐步执行,不要跳过任何步骤。
""",
model=OllamaChatModel(
model_name="qwen3:32b", # 指定模型名称
stream=True, # 根据需要设置是否流式输出
enable_thinking=True, # 为Qwen3启用思考功能(可选)
# host="http://localhost:11434" # 如果Ollama不在默认地址,需指定
),
formatter=OllamaChatFormatter(),
toolkit=toolkit,
memory=InMemoryMemory(),
)
小结
手写开发中需显式调用语义检索、SQL查询等工具,几种框架都支持通过工具注册机制自动完成调用与路由,降低耦合并增强复用。
上下文记忆对比
在AI Agent实践过程中,如果需要实现多轮对话,就会碰到上下文记忆的处理,所以接下来对这块做个对比。
1、手写代码
这种模式需要手写代码来管理上下文消息:
python
import threading
from dataclasses import dataclass
from typing importList, Dict, Any
@dataclass
class Message:
role: str# "system", "user", "assistant"
content: str
def to_dict(self) -> Dict[str, str]:
return {"role": self.role, "content": self.content}
class MessageManager:
def __init__(self, max_history: int = 10):
"""
初始化消息管理器
:param max_history: 每个 session 最多保留的历史消息数量(不包括 system 消息)
"""
self.max_history = max_history
self._sessions: Dict[str, Dict[str, Any]] = {}
self._lock = threading.Lock() # 保证线程安全
def set_system_message(self, session_id: str, content: str) -> None:
"""为指定 session 设置 system 消息(会覆盖旧的)"""
with self._lock:
if session_id notinself._sessions:
self._sessions[session_id] = {
"system": None,
"history": [] # 只存 user/assistant 对话
}
self._sessions[session_id]["system"] = Message(role="system", content=content)
def add_user_message(self, session_id: str, content: str) -> None:
"""添加用户消息"""
self._add_message(session_id, "user", content)
def add_assistant_message(self, session_id: str, content: str) -> None:
"""添加助手回复"""
self._add_message(session_id, "assistant", content)
def _add_message(self, session_id: str, role: str, content: str) -> None:
with self._lock:
if session_id notin self._sessions:
self._sessions[session_id] = {
"system": None,
"history": []
}
history = self._sessions[session_id]["history"]
history.append(Message(role=role, content=content))
# 限制历史长度(只保留最近的 max_history 条 user/assistant 消息)
if len(history) > self.max_history * 2: # 每轮对话含 user + assistant
# 保留最后 max_history * 2 条
self._sessions[session_id]["history"] = history[-(self.max_history * 2):]
def get_messages(self, session_id: str) -> List[Dict[str, str]]:
"""获取可用于 Ollama /api/chat 的 messages 列表"""
with self._lock:
session = self._sessions.get(session_id)
if not session:
return []
messages = []
# 添加 system 消息(如果有)
if session["system"]:
messages.append(session["system"].to_dict())
# 添加历史对话
for msg in session["history"]:
messages.append(msg.to_dict())
return messages
def clear_session(self, session_id: str) -> None:
"""清除指定 session 的所有消息"""
with self._lock:
self._sessions.pop(session_id, None)
def list_sessions(self) -> List[str]:
"""列出所有 session ID"""
with self._lock:
returnlist(self._sessions.keys())
def delete_session(self, session_id: str) -> bool:
"""删除 session,返回是否删除成功"""
with self._lock:
if session_id inself._sessions:
del self._sessions[session_id]
return True
return False
调用时手动传入:
python
# sql agent
def sql_agent(user_query):
# 1. 语义匹配
table = semanticService.hybrid_search(user_query, 1)
if not table:
print(f"未匹配到字段")
return Result.error()
table_struct = [t["table_info"] for t in table]
prompt = f"""
你是一个MySQL专家。根据以下表结构信息:
{table_struct}
历史问答(仅供参考):"{mm.get_messages(session_id)}"
用户查询:"{user_query}"
生成标准MYSQL查询语句。
要求:
1. 只输出MYSQL语句,不要额外解释
2. 根据语义和字段类型,使用COUNT/SUM/AVG等聚合函数进行计算,非必须
3. 给生成的字段取一个简短的中文名称
输出格式:使用[]包含sql文本即可,不需要其他输出,便于解析,例如:[select 1 from dual]
"""
print(f"SQL AGENT PROMPT={prompt}")
# 2. 大模型生成SQL
str1 = analysisService.analysis(prompt)
sql = re.search(r'[(.*?)]', str1, re.DOTALL).group(1).strip()
# 3. 执行查询
if not sql:
print("\nSQL生成失败")
return Result.error()
resultSet = queryService.query_with_column(sql)
if not resultSet:
print("\nSQL查询失败")
return Result.error()
return Result.success(data={ "tableStruct": table_struct, "resultSet": resultSet, "sql": sql })
# analysis agent
def analysis_agent(user_query, data):
# 基础分析
prompt = f"""
根据以下表结构信息:
{data['tableStruct']}
查询SQL:
{data['sql']}
和以下数据信息:
{data['resultSet']}
历史问答(仅供参考):"{mm.get_messages(session_id)}"
用户查询:"{user_query}"
生成一段简要分析,加上一些预测总结的内容
"""
print(f"ANALYSIS AGENT PROMPT={prompt}")
return Result.success(analysisService.analysis(prompt))
2、LangChain框架
Agent模式指定:
ini
# 记忆
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
# 初始化Agent
agent = initialize_agent(
tools=[semantic_tool, sql_tool],
llm=llm,
agent=AgentType.CONVERSATIONAL_REACT_DESCRIPTION,
verbose=True,
handle_parsing_errors=True,
max_iterations=10, # 增加最大迭代次数以支持多步查询
early_stopping_method="generate",
memory=memory
)
除了上面用到的 ConversationBufferMemory,LangChain还提供了多种Memory组件,以适应不同场景的需求。可以根据具体情况选择:
| Memory 类型 | 特点 | 适用场景 |
|---|---|---|
| ConversationBufferWindowMemory | 只保留最近K轮的对话内容,节省上下文空间。 | 对话频繁,且近期内容更为重要的场景。 |
| ConversationSummaryMemory | 对历史对话生成摘要,而非保存全部原文。 | 对话很长,需要压缩信息以节省Token消耗。 |
| ConversationTokenBufferMemory | 根据 Token 数量而非对话轮数来限制记忆长度。 | 需要精确控制输入给模型上下文的长度和成本。 |
- 确认Agent类型 兼容性 :在选用Memory前,请确认你使用的
AgentType支持Memory功能。例如,ZERO_SHOT_REACT_DESCRIPTION默认不支持记忆,而CONVERSATIONAL_REACT_DESCRIPTION则专为多轮对话设计。 - 注意上下文长度 :为Agent添加记忆会占用模型的上下文窗口。如果对话很长,考虑使用
ConversationSummaryMemory或ConversationBufferWindowMemory来避免超出限制。 - 调试工具 :将
verbose参数设为True,可以在控制台看到详细的决策过程,有助于观察Memory是否正常工作。
3、QwenAgent框架
Agent模式的Assistant类不支持,需要手动管理:
ini
def analysis(user_query):
try:
# 运行Agent
messages = mm.get_messages(session_id) + [{'role': 'user', 'content': user_query}]
response_generator = agent.run(messages=messages)
# 处理生成器响应
full_response = ''
start = 0
end = 0
for response in response_generator:
# 检查响应类型并适当处理
if isinstance(response, list):
# 如果是列表,提取内容
for item in response:
ifisinstance(item, dict) and'content'in item:
full_response = item['content']
end = full_response.__len__()
elifisinstance(item, str):
full_response = item
end = full_response.__len__()
elif isinstance(response, dict) and'content'in response:
full_response = response['content']
end = full_response.__len__()
elif isinstance(response, str):
full_response = response
end = full_response.__len__()
print(f"{full_response[start:end]}", end="")
start = end
print(f"最终结果: {full_response}")
# 缓存历史对话
if full_response:
mm.add_user_message(session_id, user_query)
mm.add_assistant_message(session_id, full_response)
return full_response
except Exception as e:
print(f"执行过程中出错: {str(e)}")
# 这里可以添加重试或更详细的错误处理逻辑
return f"错误: {str(e)}"
4、AgentScope框架
Agent初始化指定对应类型即可:
ini
jarvis = ReActAgent(
name="Jarvis",
sys_prompt="""
你是一个数据分析助手,负责帮助用户查询数据库信息。
请特别注意:用户的问题可能需要从多个表中查询数据。
1. 首先确定需要查询哪些数据
2. 使用match_metadata工具分别匹配包含这些数据的表结构
3. 对每个表生成相应的SQL查询语句
4. 执行查询并汇总结果
5. 最后计算并给出答案
请确保逐步执行,不要跳过任何步骤。
""",
model=OllamaChatModel(
model_name="qwen3:32b", # 指定模型名称
stream=True, # 根据需要设置是否流式输出
enable_thinking=True, # 为Qwen3启用思考功能(可选)
# host="http://localhost:11434" # 如果Ollama不在默认地址,需指定
),
formatter=OllamaChatFormatter(),
toolkit=toolkit,
memory=InMemoryMemory(),
)
小结
手写代码需自行实现消息管理和上下文传递,工作量大且需要手动维护。框架提供多样化记忆组件,支持对话上下文的灵活管理,适配不同对话场景,有效提升对话质量。
多智能体协作对比
自从Google提出A2A协议,多智能体协作已经成为业界实践过程的热点,为进一步对比手写代码和开发框架在多Agent协作上的区别,我们将本案例的程序设计拆分为以下两个Agent:
1、SQL Agent
- 调用外部语义检索(RAG)API匹配元数据
- 调用大模型根据元数据和用户提问生成查数SQL
- 调用查数API查询数据
2、Analysis Agent
- 调用大模型分析数据回答问题
1、手写代码
需要手动串联多个Agent调用,消息格式自定义传递:
python
...
def workflow(user_input):
# 1 - SQL Agent
result = sql_agent(user_input)
if not result.success:
return None
# 2 - Analysis Agent
return analysis_agent(user_input, result.data)
...
2、LangChain框架
原生仅支持单体Agent,多Agent需要手动串联,实现类似手写代码。
3、QwenAgent框架
原生仅支持单体Agent,多Agent需要手动串联,实现类似同手写代码。
4、AgentScope框架
基于AgentScope框架,我们可以把 SQLAgent 和 AnalysisAgent 封装为 两个智能体(均继承 AgentBase),然后两个智能体的协作使用顺序管道sequential_pipeline来串联,实现"多智能体任务流转"。
AgentScope 中的主要管道类型包括:
| 管道函数 | 类型 | 作用 | 特点 |
|---|---|---|---|
| sequential_pipeline | 串行 | 按顺序执行多个 Agent(A → B → C) | 简单、可控、常用于任务链 |
| parallel_pipeline | 并行 | 同时让多个 Agent 处理同一消息 | 高性能、适合意见汇总或对比 |
| broadcast_pipeline | 广播 | 将一条消息发送给多个 Agent,但每个独立回复 | 不等待所有返回,可异步 |
| loop_pipeline | 循环 | 将上一次输出作为下一轮输入,直到满足条件停止 | 适合多轮协作(例如思考-改进循环) |
| conditional_pipeline | 条件分支 | 根据消息或 Agent 输出动态选择下一个 Agent | 适合复杂决策流 |
| MsgHub | 管道 | 中心化消息调度 多 Agent 通过消息中心异步通信 | 实现发布-订阅、群聊模式 |
这几种管道协作模式,具体实践敬请期待下篇文章分享。
小结
手写代码多为线性调用,缺乏并行和复杂调度能力。AgentScope框架支持多Agent并行、条件分支、消息广播等复杂管道模式,适合构建复杂的多智能体协作系统。其他框架都需要手动组合实现。
对比总结
通过以上对比来看,在日常智能体开发中,尤其是需要多轮对话、实现多工具调用和多智能体协作时,几种开发框架确实提供了极大的便利和扩展能力,大幅降低开发门槛和维护成本,而手写代码则适合高度定制化需求,灵活性最高。
功能维度对比
| 功能模块 | 手写代码 | LangChain | Qwen-Agent | AgentScope |
|---|---|---|---|---|
| 🔗 业务流程编排 | ⚪️ 需手动串联 | ✅ 多种Chain串联,强支持 | ⚪️ 依靠提示词指定业务流程 | ⚪️ 依靠提示词指定业务流程 |
| 🌐 模型调用(LLM) | ⚪️ http调用或官方包 | ✅ 支持广泛 | ✅ 原生优化 | ✅ 可自定义适配器 |
| 🧰 工具调用(Tool) | ⚪️ 需手动调用 | ✅ 自由定义Tool/组合Tool | ✅ 原生支持 | ✅ 通过 Agent 工具化 |
| 💬 记忆(Memory) | ⚪️ 需手动管理 | ✅ 多种类型(Buffer/Entity) | ⚪️ 需手动管理 | ✅ 上下文共享MsgHub等 |
| 👥 多 Agent 协作 | ⚪️ 需手动串联 | ⚪️ 可通过手动组合实现 | ⚪️ 可通过手动组合实现 | ✅ 框架核心功能(多管道) |
| 🔧 插件生态 | ⚪️ 需自定义调用 | ✅ 庞大(社区多) | ⚪️ 早期阶段 | ⚪️ 逐步扩展中 |
选型建议
| 使用场景 | 推荐框架 | 理由 |
|---|---|---|
| 构建通用 RAG / QA 系统 | LangChain | 生态成熟、插件丰富 |
| 构建 Qwen 系列专用 Agent | Qwen-Agent | 接口最友好、集成最简单 |
| 构建多角色协作系统(Planner + Coder + Critic) | AgentScope | 专为多 Agent 协作设计 |
| 做研究型实验 / 快速原型 | Qwen-Agent / LangChain | 开发快、文档齐全 |
| 做工业级多智能体调度系统 | AgentScope | 任务协调、上下文共享更强 |
当然,当我们全定制化开发,还是手写代码更加合适。
🔹 LangChain:适合你搭建任何单体智能体系统(RAG、SQL、工具调用)。
🔹 Qwen-Agent:适合快速构建"基于 Qwen 模型"的问答或助手。
🔹 AgentScope :适合研究或实现多智能体协作系统(Planner、Coder、Critic 等角色联动)。
🔹 手写代码: 高度定制化开发,当我们的手写代码逐步抽象完善,使用的频率多了,就成了框架!
本文总结:本文通过设计高考信息查询智能助手的业务场景,分别采用手写代码和主流智能体框架(LangChain、QwenAgent、AgentScope)进行了实现与比较。我们从业务流程编排、模型调用、工具集成、上下文记忆管理以及多智能体协作等多个维度进行深入分析,对比手写代码与框架调用的异同。
本文作者:Chaiys
本文原载:公众号"木昆子记录AI"