AG-UI:连接 AI 智能体与用户应用的开放协议

什么是 AG-UI?

AG-UI(Agent-User Interaction Protocol,智能体-用户交互协议)是一个开放轻量级基于事件驱动的协议标准,旨在规范 AI 智能体与用户应用之间的连接方式。

简单来说,AG-UI 是为智能体时代设计的通用双向连接桥梁,它标准化了智能体状态、UI 意图和用户交互在模型/智能体运行时与前端应用之间的流转方式。这使得应用开发者能够快速构建可靠、可调试、用户友好的智能体功能,专注于应用需求,而无需处理复杂的临时连接逻辑。

注意:不要混淆 "A2UI" 和 "AG-UI"!A2UI 是一个生成式 UI 规范,允许智能体交付 UI 组件;而 AG-UI 是智能体与用户交互的协议,连接智能体前端与任何智能体后端。两者可以很好地协同工作。

为什么需要 AG-UI?

智能体应用的独特挑战

传统的前后端开发遵循简单的请求/响应模式:客户端发起请求,服务器返回数据,客户端渲染,交互结束。但智能体应用打破了这一模式,它们具有以下特点:

  • 长时间运行且流式输出:智能体通常需要长时间运行,并在多轮会话中流式传输中间结果
  • 非确定性:智能体行为具有不确定性,可以非确定性地控制应用 UI
  • 混合 I/O:同时处理结构化和非结构化数据(如文本、语音、工具调用和状态更新)
  • 需要组合能力:智能体可能调用子智能体,通常是递归调用

AG-UI 作为一个基于事件的协议,构建在 Web 基础协议(HTTP、WebSockets)之上,为智能体时代提供了专门的抽象层,弥合了传统客户端-服务器架构与 AI 智能体动态、有状态特性之间的鸿沟。

智能体协议生态

AG-UI 是三大开放智能体协议之一,它们各司其职:

层级 协议 用途
智能体 ↔ 用户交互 AG-UI 连接智能体与用户应用的开放标准,实现实时、多模态、交互式体验
智能体 ↔ 工具与数据 MCP 让智能体安全连接外部系统、工具、工作流和数据源
智能体 ↔ 智能体 A2A 定义智能体如何在分布式系统中协调和共享工作

核心功能特性

AG-UI 提供了丰富的功能模块,支持现代智能体应用的各种需求:

已支持功能

  • 流式聊天:实时 'token' 和事件流,支持多轮会话,可取消和恢复
  • 多模态支持:类型化附件和实时媒体(文件、图像、音频、转录),支持语音、预览、注释和溯源
  • 生成式 UI(静态):将模型输出渲染为稳定的、类型化的组件
  • 生成式 UI(声明式):用于受约束但开放式智能体 UI 的小型声明式语言
  • 共享状态:智能体和应用之间的类型化共享存储,支持流式事件溯源差异和冲突解决
  • 思考步骤:可视化中间推理过程,无需原始思维链
  • 前端工具调用:从智能体到前端执行操作的类型化交接
  • 后端工具渲染:在应用和聊天中可视化后端工具输出
  • 自定义事件:开放式数据交换,满足协议未覆盖的需求

即将推出

  • 🔄 中断机制(人在回路):在流程中暂停、批准、编辑、重试或升级,而不丢失状态
  • 🔄 子智能体和组合:嵌套委托,具有作用域状态、跟踪和取消功能
  • 🔄 智能体引导:通过实时用户输入动态重定向智能体执行
  • 🔄 工具输出流式传输:流式传输工具结果和日志,以便 UI 实时渲染长时间运行的效果

广泛的生态支持

AG-UI 诞生于 CopilotKit 与 LangGraph 和 CrewAI 的合作,现已扩展到更广泛的智能体生态系统:

支持的智能体框架

  • LangGraphCrewAI
  • Microsoft Agent FrameworkGoogle ADKAWS Strands Agents
  • MastraPydantic AIAgnoLlamaIndexAG2

SDK 支持

  • 官方:TypeScript、Python
  • 社区:Kotlin、Golang、Dart、Java、Rust
  • 进行中:.NET、Nim、Flowise、Langflow

客户端

  • CopilotKit(官方)
  • Terminal + Agent(社区)
  • React Native(征集贡献)

快速开始

根据你的需求选择合适的路径:

  1. 使用 AG-UI 构建智能体应用
  2. 为智能体框架构建新的 AG-UI 集成
  3. 构建 AG-UI 兼容客户端

在线示例

你可以在 AG-UI Dojo 中查看各种框架的 AG-UI 功能演示,包括预览、代码和详细文档。

核心概念

要深入了解 AG-UI,建议探索以下核心概念:

  • 核心架构:了解 AG-UI 如何连接智能体、协议和前端
  • 事件系统:学习 AG-UI 的事件驱动协议
  • 智能体中间件消息推理状态管理

总结

AG-UI 为智能体时代提供了一个标准化、灵活且强大的连接层,让开发者能够专注于构建出色的用户体验,而不必担心底层的复杂连接逻辑。无论你是应用开发者、智能体框架作者,还是想要构建新的客户端,AG-UI 都为你提供了坚实的基础。

AG-UI 官方文档


本文基于 AG-UI 官方文档编写,更多详细信息请访问 https://docs.ag-ui.com/introduction

相关推荐
陈天伟教授2 小时前
人工智能应用- 人工智能交叉:05. 从 AlphaFold1 到 AlphaFold2
人工智能·神经网络·算法·机器学习·推荐算法
Eloudy2 小时前
CHI 开发备忘 03 记 -- CHI spec 03 网络层
人工智能·ai·arch·hpc
Together_CZ2 小时前
ViT-5: Vision Transformers for The Mid-2020s—— 面向2020年代中期的视觉Transformer
人工智能·深度学习·ai·transformer·vit·vit-5·面向2020年代中期的视觉
badfl2 小时前
Gemini 3.1 Pro更新内容一览:介绍、令牌限制、如何使用
人工智能·ai
大模型任我行2 小时前
北大:LLM数学证明形式化验证
人工智能·语言模型·自然语言处理·论文笔记
Eloudy2 小时前
直接法 读书笔记 05 第5章 正交方法
人工智能·算法·机器学习
每日新鲜事2 小时前
青花汾酒与2026年北京台春晚共贺马年新春:以文化之酿,共贺新春吉祥
人工智能
Dev7z2 小时前
基于LSTM的共享单车需求预测研究
人工智能·rnn·lstm
加农炮手Jinx3 小时前
Flutter for OpenHarmony 实战:疯狂头像 App(三)— 复合动画与交互反馈 — 让 UI 跃动起来
flutter·ui·交互·harmonyos·鸿蒙