AG-UI:连接 AI 智能体与用户应用的开放协议

什么是 AG-UI?

AG-UI(Agent-User Interaction Protocol,智能体-用户交互协议)是一个开放轻量级基于事件驱动的协议标准,旨在规范 AI 智能体与用户应用之间的连接方式。

简单来说,AG-UI 是为智能体时代设计的通用双向连接桥梁,它标准化了智能体状态、UI 意图和用户交互在模型/智能体运行时与前端应用之间的流转方式。这使得应用开发者能够快速构建可靠、可调试、用户友好的智能体功能,专注于应用需求,而无需处理复杂的临时连接逻辑。

注意:不要混淆 "A2UI" 和 "AG-UI"!A2UI 是一个生成式 UI 规范,允许智能体交付 UI 组件;而 AG-UI 是智能体与用户交互的协议,连接智能体前端与任何智能体后端。两者可以很好地协同工作。

为什么需要 AG-UI?

智能体应用的独特挑战

传统的前后端开发遵循简单的请求/响应模式:客户端发起请求,服务器返回数据,客户端渲染,交互结束。但智能体应用打破了这一模式,它们具有以下特点:

  • 长时间运行且流式输出:智能体通常需要长时间运行,并在多轮会话中流式传输中间结果
  • 非确定性:智能体行为具有不确定性,可以非确定性地控制应用 UI
  • 混合 I/O:同时处理结构化和非结构化数据(如文本、语音、工具调用和状态更新)
  • 需要组合能力:智能体可能调用子智能体,通常是递归调用

AG-UI 作为一个基于事件的协议,构建在 Web 基础协议(HTTP、WebSockets)之上,为智能体时代提供了专门的抽象层,弥合了传统客户端-服务器架构与 AI 智能体动态、有状态特性之间的鸿沟。

智能体协议生态

AG-UI 是三大开放智能体协议之一,它们各司其职:

层级 协议 用途
智能体 ↔ 用户交互 AG-UI 连接智能体与用户应用的开放标准,实现实时、多模态、交互式体验
智能体 ↔ 工具与数据 MCP 让智能体安全连接外部系统、工具、工作流和数据源
智能体 ↔ 智能体 A2A 定义智能体如何在分布式系统中协调和共享工作

核心功能特性

AG-UI 提供了丰富的功能模块,支持现代智能体应用的各种需求:

已支持功能

  • 流式聊天:实时 'token' 和事件流,支持多轮会话,可取消和恢复
  • 多模态支持:类型化附件和实时媒体(文件、图像、音频、转录),支持语音、预览、注释和溯源
  • 生成式 UI(静态):将模型输出渲染为稳定的、类型化的组件
  • 生成式 UI(声明式):用于受约束但开放式智能体 UI 的小型声明式语言
  • 共享状态:智能体和应用之间的类型化共享存储,支持流式事件溯源差异和冲突解决
  • 思考步骤:可视化中间推理过程,无需原始思维链
  • 前端工具调用:从智能体到前端执行操作的类型化交接
  • 后端工具渲染:在应用和聊天中可视化后端工具输出
  • 自定义事件:开放式数据交换,满足协议未覆盖的需求

即将推出

  • 🔄 中断机制(人在回路):在流程中暂停、批准、编辑、重试或升级,而不丢失状态
  • 🔄 子智能体和组合:嵌套委托,具有作用域状态、跟踪和取消功能
  • 🔄 智能体引导:通过实时用户输入动态重定向智能体执行
  • 🔄 工具输出流式传输:流式传输工具结果和日志,以便 UI 实时渲染长时间运行的效果

广泛的生态支持

AG-UI 诞生于 CopilotKit 与 LangGraph 和 CrewAI 的合作,现已扩展到更广泛的智能体生态系统:

支持的智能体框架

  • LangGraphCrewAI
  • Microsoft Agent FrameworkGoogle ADKAWS Strands Agents
  • MastraPydantic AIAgnoLlamaIndexAG2

SDK 支持

  • 官方:TypeScript、Python
  • 社区:Kotlin、Golang、Dart、Java、Rust
  • 进行中:.NET、Nim、Flowise、Langflow

客户端

  • CopilotKit(官方)
  • Terminal + Agent(社区)
  • React Native(征集贡献)

快速开始

根据你的需求选择合适的路径:

  1. 使用 AG-UI 构建智能体应用
  2. 为智能体框架构建新的 AG-UI 集成
  3. 构建 AG-UI 兼容客户端

在线示例

你可以在 AG-UI Dojo 中查看各种框架的 AG-UI 功能演示,包括预览、代码和详细文档。

核心概念

要深入了解 AG-UI,建议探索以下核心概念:

  • 核心架构:了解 AG-UI 如何连接智能体、协议和前端
  • 事件系统:学习 AG-UI 的事件驱动协议
  • 智能体中间件消息推理状态管理

总结

AG-UI 为智能体时代提供了一个标准化、灵活且强大的连接层,让开发者能够专注于构建出色的用户体验,而不必担心底层的复杂连接逻辑。无论你是应用开发者、智能体框架作者,还是想要构建新的客户端,AG-UI 都为你提供了坚实的基础。

AG-UI 官方文档


本文基于 AG-UI 官方文档编写,更多详细信息请访问 https://docs.ag-ui.com/introduction

相关推荐
星星也在雾里15 小时前
Dify Agent + FastAPI + PostgreSQL实现数据库查询
数据库·人工智能·fastapi
Maschera9615 小时前
openclaw-lark 的 Bot@Bot 跨Bot提及功能 - 开发经验分享
人工智能·node.js
TDengine (老段)15 小时前
以事件为核心 + 以资产为核心:工业数据中缺失的关键一环
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据
阿里云大数据AI技术15 小时前
欣和大数据阿里云上升级,打造湖仓一体平台
大数据·人工智能
CC数分15 小时前
大模型时代的数据分析:AI会取代数据分析师吗?
人工智能·数据挖掘·数据分析
PHOSKEY15 小时前
直面消费电子检测新挑战——光子精密3D工业相机折叠屏铰链检测应用方案
人工智能
guslegend16 小时前
RAG系统的需求分析
人工智能·大模型
飞哥数智坊16 小时前
AI编程教程多到爆炸,而我依然选择再做一套,而且完全免费
人工智能
liu****16 小时前
LangChain-AI应用开发框架(二)
人工智能·python·langchain·大模型部署