了解Agent2Agent(A2A)协议:实现AI智能体间的无缝通信

Agent2Agent(A2A)协议是一种开源协议,旨在让不同框架和供应商的AI智能体之间实现无缝通信。它为智能体提供了一个共同的语言,使得它们可以相互展示能力并协商如何与用户交互。下面我们将详细介绍A2A协议的核心概念、工作流程,并提供示例代码帮助理解。

核心概念

  • Agent Card :一个公共元数据文件(通常位于 /.well-known/agent.json),描述智能体的能力、技能、端点URL和认证要求。客户端使用它来发现智能体。
  • A2A Server:一个暴露HTTP端点的智能体,实现A2A协议方法。它接收请求并管理任务执行。
  • A2A Client :一个应用程序或另一个智能体,消费A2A服务。它向A2A Server的URL发送请求(如 tasks/send)。
  • Task :工作的基本单位。客户端通过发送消息(如 tasks/sendtasks/sendSubscribe)来启动任务。任务有唯一ID,并且会经历不同的状态(已提交、正在处理、需要输入、已完成、失败、已取消)。
  • Message:客户端(角色为"用户")和智能体(角色为"代理")之间的通信轮次。消息包含多个部分(Parts)。
  • Part:消息或工件中的基本内容单元。可以是文本部分(TextPart)、文件部分(FilePart,包含内联字节或URI)或数据部分(DataPart,用于结构化JSON,如表单)。
  • Artifact:智能体在任务过程中生成的输出(例如生成的文件、最终结构化数据)。工件也包含多个部分。
  • Streaming :对于长时间运行的任务,支持流媒体的服务器可以使用 tasks/sendSubscribe。客户端接收服务器发送的事件(SSE),包含任务状态更新或工件更新事件,从而提供实时进度。
  • Push Notifications :支持推送通知的服务器可以主动将任务更新发送到客户端提供的Webhook URL,该URL通过 tasks/pushNotification/set 配置。

工作流程

  1. 发现:客户端从服务器的已知URL获取智能体卡。
  2. 启动 :客户端发送包含初始用户消息和唯一任务ID的 tasks/sendtasks/sendSubscribe 请求。
  3. 处理
    • 流媒体:服务器发送SSE事件(状态更新、工件)随着任务的进展。
    • 非流媒体:服务器同步处理任务并在响应中返回最终任务对象。
  4. 交互(可选) :如果任务进入需要输入状态,客户端使用相同的任务ID通过 tasks/sendtasks/sendSubscribe 发送后续消息。
  5. 完成:任务最终达到终止状态(已完成、失败、已取消)。

示例代码

以下是一个简单的Python示例,展示如何使用A2A协议发送任务请求:

python 复制代码
import requests

# 假设agent_card_url是智能体卡的URL
agent_card_url = "https://example.com/.well-known/agent.json"
response = requests.get(agent_card_url)
agent_card = response.json()

# 获取A2A Server的端点URL
endpoint_url = agent_card["endpoint"]

# 准备任务请求
task_id = "unique-task-id"
message = {
    "parts": [
        {
            "contentType": "text/plain",
            "body": "Hello, how are you?"
        }
    ]
}

# 发送任务请求
response = requests.post(
    f"{endpoint_url}/tasks/send",
    json={
        "taskId": task_id,
        "message": message
    }
)

print(response.json())

未来计划

A2A协议的未来计划包括:

  • 协议增强
    • 在智能体卡中正式包含授权方案和可选凭证。
    • 研究动态检查技能的方法。
    • 支持任务内的动态UX协商。
    • 扩展客户端方法支持。
    • 改进流媒体和推送通知机制的可靠性。
  • 示例和文档增强
    • 简化"Hello World"示例。
    • 提供更多不同框架集成的示例。
    • 提供更全面的客户端/服务器库文档。
    • 从JSON Schema生成可读的HTML文档。
相关推荐
Leinwin1 小时前
微软开源GitHub Copilot Chat,AI编程领域迎新突破
microsoft·github·copilot
Piper蛋窝2 小时前
深入 Go 语言垃圾回收:从原理到内建类型 Slice、Map 的陷阱以及为何需要 strings.Builder
后端·go
六毛的毛4 小时前
Springboot开发常见注解一览
java·spring boot·后端
AntBlack4 小时前
拖了五个月 ,不当韭菜体验版算是正式发布了
前端·后端·python
31535669134 小时前
一个简单的脚本,让pdf开启夜间模式
前端·后端
草梅友仁4 小时前
草梅 Auth 与 AI 开发心得 | 2025 年第 27 周草梅周报
github·ai编程·视觉设计
uzong5 小时前
curl案例讲解
后端
一只叫煤球的猫5 小时前
真实事故复盘:Redis分布式锁居然失效了?公司十年老程序员踩的坑
java·redis·后端
yanlele6 小时前
前端面试第 75 期 - 2025.07.06 更新前端面试问题总结(12道题)
前端·javascript·面试
大鸡腿同学6 小时前
身弱武修法:玄之又玄,奇妙之门
后端