AG-UI:连接 AI 智能体与用户应用的开放协议

什么是 AG-UI?

AG-UI(Agent-User Interaction Protocol,智能体-用户交互协议)是一个开放轻量级基于事件驱动的协议标准,旨在规范 AI 智能体与用户应用之间的连接方式。

简单来说,AG-UI 是为智能体时代设计的通用双向连接桥梁,它标准化了智能体状态、UI 意图和用户交互在模型/智能体运行时与前端应用之间的流转方式。这使得应用开发者能够快速构建可靠、可调试、用户友好的智能体功能,专注于应用需求,而无需处理复杂的临时连接逻辑。

注意:不要混淆 "A2UI" 和 "AG-UI"!A2UI 是一个生成式 UI 规范,允许智能体交付 UI 组件;而 AG-UI 是智能体与用户交互的协议,连接智能体前端与任何智能体后端。两者可以很好地协同工作。

为什么需要 AG-UI?

智能体应用的独特挑战

传统的前后端开发遵循简单的请求/响应模式:客户端发起请求,服务器返回数据,客户端渲染,交互结束。但智能体应用打破了这一模式,它们具有以下特点:

  • 长时间运行且流式输出:智能体通常需要长时间运行,并在多轮会话中流式传输中间结果
  • 非确定性:智能体行为具有不确定性,可以非确定性地控制应用 UI
  • 混合 I/O:同时处理结构化和非结构化数据(如文本、语音、工具调用和状态更新)
  • 需要组合能力:智能体可能调用子智能体,通常是递归调用

AG-UI 作为一个基于事件的协议,构建在 Web 基础协议(HTTP、WebSockets)之上,为智能体时代提供了专门的抽象层,弥合了传统客户端-服务器架构与 AI 智能体动态、有状态特性之间的鸿沟。

智能体协议生态

AG-UI 是三大开放智能体协议之一,它们各司其职:

层级 协议 用途
智能体 ↔ 用户交互 AG-UI 连接智能体与用户应用的开放标准,实现实时、多模态、交互式体验
智能体 ↔ 工具与数据 MCP 让智能体安全连接外部系统、工具、工作流和数据源
智能体 ↔ 智能体 A2A 定义智能体如何在分布式系统中协调和共享工作

核心功能特性

AG-UI 提供了丰富的功能模块,支持现代智能体应用的各种需求:

已支持功能

  • 流式聊天:实时 'token' 和事件流,支持多轮会话,可取消和恢复
  • 多模态支持:类型化附件和实时媒体(文件、图像、音频、转录),支持语音、预览、注释和溯源
  • 生成式 UI(静态):将模型输出渲染为稳定的、类型化的组件
  • 生成式 UI(声明式):用于受约束但开放式智能体 UI 的小型声明式语言
  • 共享状态:智能体和应用之间的类型化共享存储,支持流式事件溯源差异和冲突解决
  • 思考步骤:可视化中间推理过程,无需原始思维链
  • 前端工具调用:从智能体到前端执行操作的类型化交接
  • 后端工具渲染:在应用和聊天中可视化后端工具输出
  • 自定义事件:开放式数据交换,满足协议未覆盖的需求

即将推出

  • 🔄 中断机制(人在回路):在流程中暂停、批准、编辑、重试或升级,而不丢失状态
  • 🔄 子智能体和组合:嵌套委托,具有作用域状态、跟踪和取消功能
  • 🔄 智能体引导:通过实时用户输入动态重定向智能体执行
  • 🔄 工具输出流式传输:流式传输工具结果和日志,以便 UI 实时渲染长时间运行的效果

广泛的生态支持

AG-UI 诞生于 CopilotKit 与 LangGraph 和 CrewAI 的合作,现已扩展到更广泛的智能体生态系统:

支持的智能体框架

  • LangGraphCrewAI
  • Microsoft Agent FrameworkGoogle ADKAWS Strands Agents
  • MastraPydantic AIAgnoLlamaIndexAG2

SDK 支持

  • 官方:TypeScript、Python
  • 社区:Kotlin、Golang、Dart、Java、Rust
  • 进行中:.NET、Nim、Flowise、Langflow

客户端

  • CopilotKit(官方)
  • Terminal + Agent(社区)
  • React Native(征集贡献)

快速开始

根据你的需求选择合适的路径:

  1. 使用 AG-UI 构建智能体应用
  2. 为智能体框架构建新的 AG-UI 集成
  3. 构建 AG-UI 兼容客户端

在线示例

你可以在 AG-UI Dojo 中查看各种框架的 AG-UI 功能演示,包括预览、代码和详细文档。

核心概念

要深入了解 AG-UI,建议探索以下核心概念:

  • 核心架构:了解 AG-UI 如何连接智能体、协议和前端
  • 事件系统:学习 AG-UI 的事件驱动协议
  • 智能体中间件消息推理状态管理

总结

AG-UI 为智能体时代提供了一个标准化、灵活且强大的连接层,让开发者能够专注于构建出色的用户体验,而不必担心底层的复杂连接逻辑。无论你是应用开发者、智能体框架作者,还是想要构建新的客户端,AG-UI 都为你提供了坚实的基础。

AG-UI 官方文档


本文基于 AG-UI 官方文档编写,更多详细信息请访问 https://docs.ag-ui.com/introduction

相关推荐
phltxy7 分钟前
MCP 从协议到 Spring AI 实战
人工智能·spring·oracle
Sirius Wu18 分钟前
Agentic端到端&分离式RL技术建设
人工智能·深度学习·机器学习·caffe
AI导出鸭PC端30 分钟前
智谱清言怎么生成word文档?AI导出鸭终结乱码烦恼
人工智能·ai·c#·word·豆包·ai导出鸭
格桑阿sir31 分钟前
17-大模型智能体开发工程师:深入学习Agent记忆系统
人工智能·记忆存储·记忆系统·agent记忆·嵌入式数据库·agent进化·记忆检索
数据仓库搬砖人33 分钟前
LangGraph 原理深度解析:为什么它是目前最适合构建 Agent 的框架
人工智能
孟陬43 分钟前
国外技术周刊 #139:LLM 正在杀死程序员的「懒惰美德」
前端·人工智能·后端
Peter·Pan爱编程1 小时前
23. 算法库:用算法代替手写循环
c++·人工智能·算法
Nile1 小时前
Claude Code-Dynamic Workflows:1.为什么用工作流?
人工智能·ai·ai编程·ai-native
狂炫冰美式1 小时前
AI 生成 Draw.io,导入飞书/Lark 画板后可编辑
前端·人工智能·后端
战族狼魂1 小时前
从零构建企业级Hermes-Agent:复杂任务拆解、工具协同与安全落地实践
开发语言·人工智能·python