让 AI 学会"组队打怪"——聊聊微软的 AutoGen 框架

你有没有想过，一个 AI 助手再聪明，终究也是一个人在战斗。它写完代码没人 review，它做完分析没人挑刺，它回答问题也没人帮忙查漏补缺。

但如果让好几个 AI 坐在一起，各管一摊，一个写、一个审、一个改，会怎样？

这就是微软开源的 AutoGen 在做的事情。

一句话说清楚它是什么

AutoGen 是一个用 Python 搭建多智能体应用的框架。说白了，它让你可以创建多个各有分工的 AI 角色，让它们自己聊着把活儿干了。

比如你可以安排一个"写手"负责起草文案，再安排一个"编辑"负责提修改意见，写手改完再让编辑看，来回几轮直到编辑满意为止。整个过程不需要你盯着，它们自己就能协商完成。

这不是什么遥远的概念，装两个包就能跑起来。

怎么装？怎么用？

环境要求很简单：Python 3.10 以上就行。打开终端敲一行命令：

bash 复制代码

pip install -U "autogen-agentchat" "autogen-ext[openai]"

装好之后，最基础的用法是创建一个带工具的 AI 助手。举个例子，做一个能查天气的智能体：

python 复制代码

import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_ext.models.openai import OpenAIChatCompletionClient

async def get_weather(city: str) -> str:
    return f"{city}今天 25°C，晴。"

model_client = OpenAIChatCompletionClient(model="gpt-4o")
agent = AssistantAgent(
    name="weather_agent",
    model_client=model_client,
    tools=[get_weather],
)

async def main():
    result = await agent.run(task="北京今天天气怎么样？")
    print(result.messages[-1].content)

asyncio.run(main())

你定义一个普通的 Python 函数，把它扔进 tools 参数里，AI 就自动知道什么时候该调用它。函数签名和注释会被自动转成工具描述，不需要你手动写 JSON schema。

真正有意思的部分：多个 AI 协作

单个智能体只是开胃菜。AutoGen 真正的看家本领是让多个智能体组队工作。

框架内置了几种编排模式，最常用的是 RoundRobinGroupChat------大家轮流发言。你可以设一个终止条件，比如当某个角色说出"通过"这个词就停下来：

python 复制代码

from autogen_agentchat.teams import RoundRobinGroupChat
from autogen_agentchat.conditions import TextMentionTermination

team = RoundRobinGroupChat(
    [writer_agent, reviewer_agent],
    termination_condition=TextMentionTermination("通过"),
)
result = await team.run(task="写一段产品介绍文案")

除了轮流发言，还有 SelectorGroupChat，由一个 LLM 来判断下一个该谁说话，适合角色更多、分工更复杂的场景。还有 Swarm 模式，智能体之间可以主动"转交"任务，像客服系统的分级处理一样。

它的架构长什么样

AutoGen 分三层。最底下的 Core 层负责消息传递和运行时调度，属于基础设施。中间的 AgentChat 层是大多数人打交道的地方，预设智能体、团队编排、终止条件都在这一层。最外面的 Extensions 层负责对接各种外部服务，比如 OpenAI 的模型、Docker 代码执行器，以及通过 MCP 协议接入 Jira、Slack 等工具。

这种分层的好处是，你可以只用上层 API 快速出原型，也可以深入底层做精细控制。

还有个不用写代码的选项

如果你不想写代码，AutoGen 还提供了一个叫 AutoGen Studio 的可视化工具。装好之后一行命令启动：

bash 复制代码

pip install -U autogenstudio
autogenstudio ui --port 8080

打开浏览器就能拖拖拽拽搭建多智能体工作流，适合做快速验证和演示。

适合什么场景

说实话，不是所有任务都需要多智能体。一个简单的问答，一个 AI 就够了，上多智能体反而是大炮打蚊子。

但有些场景确实适合：需要反复打磨的内容创作、多角度的分析研判、有明确流程的任务处理（比如先分类再路由再执行），以及需要调用多种外部工具协同完成的复杂工作流。

核心判断标准就一个：如果你发现自己在不断地把一个 AI 的输出复制粘贴给另一个 AI 让它接着处理，那多半可以用 AutoGen 把这个链路自动化掉。

AutoGen 当前稳定版本为 v0.7.5，项目地址：github.com/microsoft/autogen