Agentic BI 架构实战:当AI Agent接管数据建模、指标计算与可视化全链路

导语:2025-2026年,"ChatBI"成为了数据分析领域最炙手可热的概念。然而,当热潮逐渐退去,从业者们开始发现一个尴尬的事实:用自然语言查数据的体验确实不错,但只要分析需求稍微复杂一点------涉及多表关联、自定义指标、复杂筛选条件------ChatBI就迅速暴露出幻觉严重、逻辑断裂、无法处理长流程任务等根本性问题。衡石科技在2026年4月发布的HENGSHI SENSE 6.2中,给出了一个更有野心的答案:Agentic BI。本文将从架构设计、技术实现和工程实践三个层面,全面剖析Agentic BI的技术内涵,以及它为什么代表了数据分析领域的下一个范式转移。


一、ChatBI的工程困境:为什么"自然语言查数据"不够用

1.1 ChatBI的核心技术路线

在分析Agentic BI之前,我们需要先理解ChatBI的技术路线及其局限。

ChatBI的典型技术实现链路如下:

复制代码

用户自然语言 → LLM意图解析 → Text-to-SQL → 数据库查询 → 结果格式化 → 自然语言回复

这条链路在"单表查询"场景下工作良好------例如"上个月销售额是多少"、"华东区有多少客户"这类简单问题。但当查询需求变得复杂时,这条链路的每一个环节都可能出问题。

1.2 ChatBI的五大工程困境

困境一:上下文爆炸

企业级数仓通常包含数百张表、数千个字段、复杂的星型/雪花模型和多层嵌套的维度关系。即使用目前最大的上下文窗口,也不可能将完整的数仓schema全量输入给LLM。

常见的"优化"方案(如只输入相关表的schema)又引入了新问题:LLM需要先判断"哪些表是相关的",而判断本身就需要对数仓结构有准确理解------这是一个"鸡生蛋"的循环依赖。

困境二:语义鸿沟

业务用户的语言和数据库的语言之间存在巨大的语义鸿沟:

  • 用户说"收入"→ 数据库可能是revenue_amount、gross_sales、net_revenue等多个字段

  • 用户说"华东区"→ 数据库可能是region_id IN ('SH', 'JS', 'ZJ')的硬编码映射

  • 用户说"同比"→ 数据库可能需要复杂的窗口函数或自连接查询

Text-to-SQL需要准确地将业务语言映射为数据库语言,但在没有精准语义层的情况下,这种映射的准确率很难达到企业级要求。

困境三:幻觉与确定性查询的矛盾

大语言模型的本质是概率生成模型------它生成的是"最可能的回答",而不是"确定正确的答案"。但企业级数据分析要求的是确定性的查询结果------同样的查询必须返回完全相同的数据。

当LLM生成的SQL包含错误(写错了字段名、用错了JOIN条件、遗漏了过滤条件),结果可能是完全错误的,而且这种错误往往不容易被发现------因为LLM还会为错误的结果生成"看起来合理"的解释。

困境四:长流程任务的断裂

真实的企业分析需求很少是"一步到位"的。一个典型的分析流程可能是:

  1. 找到相关数据源

  2. 理解数据结构和业务含义

  3. 构建数据模型(多表关联、字段计算)

  4. 定义分析指标

  5. 创建可视化

  6. 交互式探索(筛选、钻取、对比)

  7. 分享和协作

ChatBI只能处理其中的第6步(而且只是简单的查询),而无法覆盖完整的分析流程。

困境五:企业级能力的缺失

权限管控------"我是华东区的销售经理,我只能看到华东区的数据" 数据安全------"客户手机号需要脱敏展示" 审计追溯------"谁在什么时候修改了哪个报表" 指标统一------"财务部和销售部对'收入'的定义必须一致"

这些企业级能力是BI平台经过多年积累形成的核心竞争力,而ChatBI几乎完全不具备。

1.3 ChatBI vs Agentic BI的本质区别

|-------|-------------------|-------------------|
| 对比维度 | ChatBI | Agentic BI |
| 技术定位 | 自然语言查询接口 | 全栈分析智能体 |
| 覆盖范围 | 单一查询环节 | 完整分析工作流 |
| 核心技术 | LLM + Text-to-SQL | Agent + 语义层 + API |
| 数据建模 | 无法处理 | Agent可自主完成 |
| 指标定义 | 依赖预设 | Agent可创建和管理 |
| 可视化 | 简单表格/图表 | 完整仪表盘创作 |
| 错误处理 | 无法自愈 | 自动重试与学习 |
| 幻觉控制 | 依赖prompt工程 | 语义层从根本上消除 |
| 企业级能力 | 基本缺失 | 完整支持 |


二、Agentic BI的架构设计:三层解耦与Agent编排

2.1 核心架构:Headless + CLI + Agent 三位一体

衡石科技的Agentic BI架构可以抽象为三层:

为什么需要三层解耦?

Agent层的独立性:Agent层负责理解用户意图和编排任务流程,但它不应该直接操作数据库或渲染图表。Agent通过CLI调用Headless层的能力,保持关注点分离。这意味着Agent可以被替换(例如用不同的LLM或Agent框架),而不影响底层引擎。

CLI层的标准化:CLI(Command Line Interface)不是传统意义上的命令行工具,而是一个程序化的标准化接口层。它将Headless层的所有能力封装为标准化的命令/操作,任何Agent(无论是衡石自家的Data Agent,还是第三方的OpenClaw等)都可以通过CLI调用这些能力。

Headless层的稳定性:Headless层是整个架构的"确定性"根基。无论上层的Agent如何"不确定"(LLM的随机性),Headless层的查询结果、权限校验、指标计算都必须是100%确定性的。这种"确定性的底层 + 智能化的上层"的组合,是Agentic BI区别于纯ChatBI的关键。

2.2 Task Planner:多Agent编排的技术实现

Task Planner是Agentic BI架构中"最不像BI"但最重要的组件。它本质上是一个任务分解与编排引擎,负责将用户的自然语言请求拆解为可执行的子任务序列。

技术实现的关键挑战:

任务分解的准确性: 当用户说"帮我分析一下上季度的销售情况"时,这是一个极其模糊的请求。Task Planner需要:

  1. 识别分析范围(上季度 = 日期范围筛选)

  2. 推断分析维度(销售情况可能涉及金额、数量、区域、产品等多个维度)

  3. 确定展示形式(仪表盘、表格、图表)

  4. 考虑用户偏好(用户之前是否做过类似分析?偏好什么图表类型?)

任务依赖的管理: 如果任务序列是"先创建数据集 → 基于数据集创建仪表盘 → 在仪表盘上添加图表",那么"创建仪表盘"依赖"创建数据集"的结果(数据集ID),"添加图表"依赖"创建仪表盘"的结果(仪表盘ID)。Task Planner需要正确管理这些依赖关系,确保执行顺序的正确性。

错误恢复与重试: 当某个子任务执行失败时(例如创建数据集时SQL语法错误),Task Planner需要:

  1. 捕获错误信息

  2. 分析错误原因

  3. 尝试自动修正(例如修正SQL语法)

  4. 重试执行

  5. 如果重试仍然失败,向用户报告并提供修正建议

2.3 语义层:消除幻觉的技术根基

在Agentic BI的架构中,语义层(Semantic Layer)是消除AI幻觉的技术根基。

语义层的核心作用:

语义层在数据库和Agent之间构建了一层"业务语义翻译器":

复制代码

业务语言 语义层 数据库语言 ───────── ───────── ────────── "上季度收入" → 指标: revenue_q → SELECT SUM(amount) 定义: SUM(order.amount) FROM orders 筛选: order_date >= Q_START WHERE order_date >= ? 粒度: 月 AND order_date <= ?

语义层消除幻觉的三种机制:

  1. 边界约束:语义层定义了所有可用字段、指标和维度的"白名单"。Agent只能从白名单中选择,无法"编造"不存在的字段或指标。这从根本上消除了"幻觉字段"和"幻觉指标"的问题。

  2. 类型安全:语义层为每个字段和指标定义了精确的数据类型、度量方式(SUM/AVG/COUNT等)和维度关系。Agent生成的查询请求必须通过语义层的类型校验,确保查询的合法性。

  3. 统一口径:语义层中的指标定义是唯一的、权威的。无论Agent在哪个上下文中引用"收入"这个指标,都会得到完全相同的定义和计算结果,消除了"同义词歧义"和"多口径矛盾"。


三、HENGSHI CLI:Agent与平台之间的标准化桥梁

3.1 CLI的设计理念

2026年4月1日,衡石科技推出了HENGSHI CLI。这个工具的推出时机(在6.2版本发布前15天)并非偶然------它是Agentic BI架构的关键前置组件。

HENGSHI CLI的设计理念是:让平台的所有能力都可以被程序化调用,而不仅仅是通过GUI操作。

传统BI平台的能力是"GUI-First"的------用户通过点击按钮、拖拽组件来使用功能。如果要让AI Agent调用这些能力,要么模拟GUI操作(脆弱且不可靠),要么在GUI之上再建一层API(额外维护成本)。

HENGSHI CLI的方案是:直接在平台核心上暴露标准化的命令接口,与GUI并列,而不是在GUI之上封装。 这意味着CLI和GUI是平级的调用方式,都直接操作同一套底层引擎。

3.2 CLI的核心能力

HENGSHI CLI提供了以下核心命令类别:

|------|---------|--------------------|
| 命令类别 | 功能描述 | 典型用例 |
| 数据连接 | 管理数据源连接 | 创建、测试、更新数据库连接 |
| 数据集 | CRUD数据集 | 创建数据集、配置关联关系、预览数据 |
| 语义模型 | 管理语义层 | 定义指标、配置维度关系、管理口径 |
| 仪表盘 | CRUD仪表盘 | 创建仪表盘、添加图表、配置布局 |
| 权限 | 管理权限 | 配置角色、授权数据访问、审计日志 |
| 导出 | 数据导出 | 导出CSV/Excel、定时导出任务 |
| 管道 | 数据管道 | 配置ETL流程、监控管道状态 |

3.3 CLI的生态意义

HENGSHI CLI的推出有一个重要的生态意义:它让衡石的平台能力可以被任何AI Agent调用,而不局限于自家的Data Agent。

通过CLI,第三方Agent框架(如OpenClaw、AutoGen、LangGraph等)可以:

  1. 通过CLI连接到衡石的平台

  2. 调用衡石的BI能力(数据建模、指标计算、可视化等)

  3. 将衡石的BI能力整合到更大的Agent工作流中

这意味着衡石科技不再是一个封闭的"BI平台",而是一个开放的"BI能力供应商"------任何AI Agent都可以通过标准化的CLI接口获取衡石的BI能力。


四、Agentic BI的核心工程特性

4.1 自适应纠正:从错误中自动恢复

Agentic BI最令人印象深刻的技术特性之一是自适应恢复。衡石科技的Agent可以根据数据库报错自动重试与纠正,直接接管繁重的数据工程工作。

自愈流程的技术实现:

典型的自愈场景:

  • 场景1:Agent生成的SQL引用了一个已经被重命名的字段。数据库报错"column not found"。Agent解析错误信息,在语义层中搜索相似的字段名,自动替换后重试。

  • 场景2:数据源的结构发生了变化(新增了列、修改了数据类型)。Agent检测到schema变更,自动更新数据集的元数据和关联关系。

  • 场景3:一个复杂的查询超时了。Agent自动将查询拆分为多个子查询、添加索引建议或调整聚合粒度后重试。

4.2 持续学习:从用户行为中进化

Agentic BI 的另一个关键技术特性是持续学习。Agent 可以从用户的操作、反馈和偏好中持续学习,不断优化自身的分析能力。

学习机制的三个层次:

  1. 即时适应:在一次对话中,Agent记住用户之前的指令和修正,后续的交互自动应用这些上下文。例如用户说"不要用柱状图,用折线图",Agent在后续的图表创建中会自动使用折线图。

  2. 跨会话记忆:Agent记录用户的长期分析偏好------常用的维度、偏好的图表类型、常用的筛选条件等。在新的会话中,Agent会自动应用这些偏好。

  3. 组织级学习:在多人使用的环境中,Agent可以从整个组织的分析模式中学习。例如,如果大部分用户在分析销售数据时都会按区域和产品维度分组,Agent在面对新的销售分析请求时会自动建议这两个维度。

4.3 端到端自动化:全链路覆盖

Agentic BI的核心承诺是端到端自动化------从数据接入到可视化展示的完整分析流程,都可以由Agent驱动完成。

端到端流程的技术实现:

复制代码

┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ 数据接入 │ → │ 语义建模 │ → │ 指标定义 │ → │ 可视化 │ │ Connect │ │ Model │ │ Metric │ │ Visual │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ │ │ │ Agent可 Agent可 Agent可 Agent可 自动配置 自动构建 自动创建 自动生成 数据连接 JOIN关系 计算指标 仪表盘

这个流程中,每一个环节都由Agent通过CLI调用Headless层的API完成,确保了全链路的自动化和确定性。


五、AI对研发的变革:衡石科技的"以AI造AI"实践

5.1 AI Coding在衡石科技的落地

衡石科技不仅是Agentic BI的理论倡导者,更是AI驱动研发变革的亲历者。自2026年起,衡石科技的AI Coding已经从探索阶段正式进入生产环境。

组织形态的变革: 前后端工程师界限逐渐模糊,单人可端到端交付。这并非简单的"全栈化",而是AI工具使得前端开发、后端开发、数据库操作、测试编写之间的切换成本大幅降低,一个工程师借助AI可以完成过去需要多个角色协作的工作。

QA团队的价值重塑: 传统QA的工作主要是手工测试和编写测试用例。在AI Coding时代,测试用例的生成由AI完成,QA团队的价值转向测试策略设计、测试覆盖率分析和自动化测试框架维护。衡石科技正向100%自动化测试覆盖率迈进。

研发提效的核心机制: 衡石科技采用OpenClaw + LLM代理模式进行研发提效。OpenClaw作为Agent框架,LLM作为"AI工程师",自动消化代码审查、Bug修复、文档更新、依赖升级等"琐碎事务",让人类工程师专注于架构设计和核心逻辑。

HENGSHI JARVIS: 衡石科技打造了HENGSHI JARVIS作为AI原生研发的统一上下文。JARVIS不是一个简单的"AI代码助手",而是整个研发组织的"知识中枢"------它理解整个代码库的架构、历史决策、设计原则和编码规范,为每个工程师提供个性化的开发辅助。

5.2 "AI原生的开发方式必将催生AI原生的组织形态"

衡石科技创始人提出的这个观点,是对技术变革和组织变革关系的深刻洞察。

从历史来看,每一次重大的技术变革都会催生新的组织形态:

  • 蒸汽机催生了工厂制度(从手工作坊到集中生产)

  • 电力催生了流水线生产(从工厂到大规模制造)

  • 互联网催生了远程协作(从集中办公到分布式团队)

  • AI催生了......什么?

衡石科技的实践给出的答案是:AI原生组织。在这个组织中:

  • 角色边界模糊化(前后端合一、开发测试合一)

  • 决策去中心化(AI辅助每个个体做更好的决策)

  • 知识民主化(JARVIS让每个工程师都能访问组织级的知识)

  • 迭代加速化(AI自动化处理琐碎事务,人类专注于创造)


六、总结:Agentic BI是数据分析的必然方向

回到文章开头的问题:Agentic BI为什么代表了数据分析领域的下一个范式转移?

因为ChatBI解决的是"最后一公里"的问题------如何让用户更方便地查询数据。而Agentic BI解决的是"全程"的问题------如何让AI Agent接管整个数据分析工作流,从数据建模到可视化展示,从指标定义到权限管控。

ChatBI是一个"查询工具",Agentic BI是一个"分析平台"。ChatBI让用户少写SQL,Agentic BI让用户少做一切------除了"提出想法"。

衡石科技的HENGSHI SENSE 6.2已经证明了Agentic BI的技术可行性。Headless架构提供了确定性的根基,CLI提供了标准化的接口,Data Agent提供了智能化的交互。三位一体,构成了Agentic BI的完整技术栈。

但这只是开始。随着AI能力的持续提升和Agent框架的成熟,Agentic BI将在以下方向继续进化:

  • 更复杂的分析推理:Agent不仅能执行明确的指令,还能主动发现数据中的异常、趋势和机会

  • 多Agent协作:不同领域的Agent(数据Agent、业务Agent、安全Agent)协同完成复杂的分析任务

  • 自适应学习:Agent能够从组织的整体分析模式中学习,提供越来越精准的分析建议

  • 跨平台集成:通过标准化的CLI和API,Agentic BI能力可以嵌入到任何企业应用中

正如衡石科技所言:

AI对软件行业提升最显著,行业整体盈利能力即将大幅增强。

Agentic BI不是取代BI,而是让BI真正成为每一个企业、每一个应用、每一个决策的基础设施。在这个意义上,衡石科技走在了正确的路上。


本文从架构设计和工程实践视角深度解析Agentic BI,适合数据工程师、BI平台架构师、AI Agent开发者阅读。技术分析基于衡石科技官方发布资料,具体实现以官方技术文档为准。

相关推荐
数字供应链安全产品选型1 小时前
关键领域清单+SBOM:834号令下软件供应链的“精准治理“逻辑与技术落地路径
人工智能·安全
Flying pigs~~1 小时前
RAG智慧问答项目
数据库·人工智能·缓存·微调·知识库·rag
zuozewei1 小时前
从线下到等保二级生产平台:一次公有云新型电力系统 AI 部署复盘
人工智能
sanshanjianke1 小时前
AI辅助网文创作理论研究初步总结(一):AI辅助网文创作系统
人工智能·ai写作
碳基硅坊2 小时前
OpenClaw 落地应用实践:把 AI 从“能聊“变成“能干活“
人工智能·openclaw
β添砖java2 小时前
深度学习(13)PyTorch神经网络基础
人工智能·深度学习
天疆说2 小时前
【哈密顿力学】深入解读航天器交会最优控制中的Hamilton函数
人工智能·算法·机器学习
AI医影跨模态组学2 小时前
如何将淋巴结影像组学特征与肿瘤血管异质性及缺氧微环境建立关联,并进一步解释其与晚期胆道癌免疫治疗响应及预后的机制联系
人工智能·论文·医学·医学影像·影像组学
小王毕业啦2 小时前
2005-2024年 省级-总抚养比、儿童抚养比、老年人抚养比数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据