Agent2Agent(A2A)协议是一种开源协议,旨在让不同框架和供应商的AI智能体之间实现无缝通信。它为智能体提供了一个共同的语言,使得它们可以相互展示能力并协商如何与用户交互。下面我们将详细介绍A2A协议的核心概念、工作流程,并提供示例代码帮助理解。
核心概念
- Agent Card :一个公共元数据文件(通常位于
/.well-known/agent.json
),描述智能体的能力、技能、端点URL和认证要求。客户端使用它来发现智能体。 - A2A Server:一个暴露HTTP端点的智能体,实现A2A协议方法。它接收请求并管理任务执行。
- A2A Client :一个应用程序或另一个智能体,消费A2A服务。它向A2A Server的URL发送请求(如
tasks/send
)。 - Task :工作的基本单位。客户端通过发送消息(如
tasks/send
或tasks/sendSubscribe
)来启动任务。任务有唯一ID,并且会经历不同的状态(已提交、正在处理、需要输入、已完成、失败、已取消)。 - Message:客户端(角色为"用户")和智能体(角色为"代理")之间的通信轮次。消息包含多个部分(Parts)。
- Part:消息或工件中的基本内容单元。可以是文本部分(TextPart)、文件部分(FilePart,包含内联字节或URI)或数据部分(DataPart,用于结构化JSON,如表单)。
- Artifact:智能体在任务过程中生成的输出(例如生成的文件、最终结构化数据)。工件也包含多个部分。
- Streaming :对于长时间运行的任务,支持流媒体的服务器可以使用
tasks/sendSubscribe
。客户端接收服务器发送的事件(SSE),包含任务状态更新或工件更新事件,从而提供实时进度。 - Push Notifications :支持推送通知的服务器可以主动将任务更新发送到客户端提供的Webhook URL,该URL通过
tasks/pushNotification/set
配置。
工作流程
- 发现:客户端从服务器的已知URL获取智能体卡。
- 启动 :客户端发送包含初始用户消息和唯一任务ID的
tasks/send
或tasks/sendSubscribe
请求。 - 处理 :
- 流媒体:服务器发送SSE事件(状态更新、工件)随着任务的进展。
- 非流媒体:服务器同步处理任务并在响应中返回最终任务对象。
- 交互(可选) :如果任务进入需要输入状态,客户端使用相同的任务ID通过
tasks/send
或tasks/sendSubscribe
发送后续消息。 - 完成:任务最终达到终止状态(已完成、失败、已取消)。
示例代码
以下是一个简单的Python示例,展示如何使用A2A协议发送任务请求:
python
import requests
# 假设agent_card_url是智能体卡的URL
agent_card_url = "https://example.com/.well-known/agent.json"
response = requests.get(agent_card_url)
agent_card = response.json()
# 获取A2A Server的端点URL
endpoint_url = agent_card["endpoint"]
# 准备任务请求
task_id = "unique-task-id"
message = {
"parts": [
{
"contentType": "text/plain",
"body": "Hello, how are you?"
}
]
}
# 发送任务请求
response = requests.post(
f"{endpoint_url}/tasks/send",
json={
"taskId": task_id,
"message": message
}
)
print(response.json())
未来计划
A2A协议的未来计划包括:
- 协议增强 :
- 在智能体卡中正式包含授权方案和可选凭证。
- 研究动态检查技能的方法。
- 支持任务内的动态UX协商。
- 扩展客户端方法支持。
- 改进流媒体和推送通知机制的可靠性。
- 示例和文档增强 :
- 简化"Hello World"示例。
- 提供更多不同框架集成的示例。
- 提供更全面的客户端/服务器库文档。
- 从JSON Schema生成可读的HTML文档。