被低估的数据底座,正在决定 AI 时代智能应用的上限

数据,在 AI 时代被讨论得越来越多。长文本是数据,沉淀的代码是数据,企业经营过程中的订单、用户、供应链、渠道、客服、财务,亦是企业重要数据。

但在这个时间点,我们仍然想强调一个容易被忽视、却越来越关键的观点:AI 越火,企业越需要重新审视数据底座,否则AI带来的可能不是效率提升,而是系统性误判风险。

过去几年,行业把大量注意力放在模型能力、参数规模、推理能力上,但真正进入企业落地后,越来越多问题在真实业务中被放大,甚至开始直接影响经营判断与执行结果:

高管询问"Q3 XX为什么下滑",AI 生成了一份逻辑完整却方向错误的分析,可能直接导致错误资源配置决策;客服 Agent 因为知识来源不一致,对同一问题给出互相矛盾的答案,进而破坏客户信任一致性;运营 Agent 虽然能够调用大量数据,却无法真正识别"什么属于异常",导致风险在未被识别的情况下持续放大。

外界习惯把这些问题归因于"大模型幻觉",但在真实企业环境中,问题很多时候并不出在模型本身,而出在更底层的数据基础设施。

模型越来越像"大脑",但企业的数据底座,才是真正决定 AI 能否"看清现实"的感官系统。如果底层数据定义混乱、指标口径不统一、知识无法沉淀、服务无法实时响应,那么再强的模型,也只能在错误信息之上生成"结构化误导"。

这也是为什么,Kyligence 提出 Data+AI 战略以来,从 Copilot 演进到 Agent 阶段,"准确、安全、可靠"始终是产品建设最核心的原则。因为企业真正需要的,从来不是"会聊天的 AI",而是能够进入业务系统、理解业务逻辑、参与经营决策的 AI。

而这背后,本质上是一场数据基础设施的重构。

1 语义层建设 VS 宽表建设:AI 时代,长期主义开始兑现价值

语义层建设与宽表式建设,企业其实并不陌生。

过去一轮数据基建中,两种路线长期并存,本质上也是"长期主义"与"短期效率"的取舍。

宽表式建设(或场景化建设)的核心逻辑,是围绕具体业务场景快速交付。它投入相对可控、上线周期短、短期价值明显,因此在大量企业中成为主流选择。很多组织并不是不知道语义层的重要性,而是在业务压力、ROI 压力与组织协同难度下,更倾向于"先解决眼前问题"。

但问题在于,宽表天然是"面向场景"的,而不是"面向理解"的。

它可以支撑 BI 报表,却很难支撑 Agent。它可以满足固定分析,却很难支撑开放式问答。它可以解决"取数",却无法解决"理解数据"。

过去这些问题并不明显,因为大多数数据消费行为仍然依赖专业分析师、数据团队与固定流程。但 AI 出现后,这一矛盾被瞬间放大。

因为 Agent 并不是按照"表结构"理解世界,而是按照"业务语义"理解世界。如果企业没有统一的指标定义、维度体系与业务语义,Agent 即使能访问全部数据,也依然无法真正理解业务。

这也是为什么,在 AI 时代,语义层的价值正在被重新放大。

统一语义层解决的,不只是数据治理问题,而是"业务语言"与"机器语言"的映射问题。它让 GMV、同店增长、高净值用户、异常订单、流失风险这些原本存在于业务经验中的概念,第一次能够被系统化、标准化、机器化理解。

从这个角度看,语义层不再是 BI 时代的"高级配置",而是 Agent 时代的数据操作系统。

这也意味着,停留在宽表阶段的数据体系,在 Agent 时代会逐渐暴露出结构性能力缺口。

Kyligence 案例:某头部保险集团语义层实践

该拥有上万代理人的保险集团长期存在指标口径不统一问题,核心指标在多系统间计算方式不一致,导致分析依赖人工对齐,归因周期长达2--3天。引入 Kyligence 一站式指标平台后,企业构建统一语义层,将分散数据标准化为统一业务指标,并支持 AI 基于语义层进行自然语言查询与分析。

最终,归因分析时间缩短至20分钟,区域工单量下降约70%,一线自主用数比例提升至72%。更关键的是,企业从"依赖人工解释数据",转向"系统自动解释业务变化"。

2 数据 + 知识 → 决策:AI 正在从"回答问题"走向"参与经营"

过去的数据系统,本质上解决的是"看见结果"。

但今天的 AI,正在进一步走向"理解原因"与"辅助决策"。这意味着,企业的数据体系正在从"数据平台"演变为"知识平台",甚至进一步演变为"经营逻辑平台"。

很多人对 AI 的理解仍停留在"自然语言问数",但在真实企业场景中,真正有价值的并不是"帮你查一个数",而是:这个数意味着什么?是否异常?背后的驱动因素是什么?下一步应该如何调整?例如:

"本季度同店增长多少算健康?" "物流损耗率超过多少需要预警?" "哪些门店下滑属于季节性波动,哪些是真实经营问题?" "提升单店营收的最佳实践有哪些,分别适用于哪些前置条件?"

这些问题已经不是数据问题,而是"数据 + 行业知识 + 经营经验"的复合问题。而这也是为什么 Ontology(本体)在新一代 Data+AI 架构中越来越关键。

本体本质上是在定义"企业如何理解世界"。

指标平台则成为承载企业知识最自然的结构:指标、维度、业务规则、异常阈值、经营经验与行业规则,都可以沉淀在统一体系中。

当这些知识被结构化之后,AI 才第一次真正具备"理解业务"的能力。

未来的数据平台不再只是"数据仓库",而是企业经营经验的数字化载体。AI 也将从"数据助手",逐步演进为"经营协同者"。

Kyligence 案例:某连锁零售企业经营决策升级

该全国连锁零售企业此前依赖人工分析经营报表,面对门店下滑或区域差异问题时,需要多部门拉数对齐,决策周期长且口径不一致。引入语义化指标体系后,企业将同店增长、客流转化率、库存周转等核心指标统一沉淀为标准语义,并构建指标规则与阈值体系。

基于该体系,管理层可通过自然语言直接查询异常门店及原因,系统自动结合指标规则与趋势完成分析,使经营模式从"事后报表驱动"升级为"实时决策支持"。

3 数据服务的实时化:从"批处理时代"进入"实时决策时代"

很多企业的数据体系,本质上仍然停留在"昨天的世界"。

T+1 跑批、日报驱动经营,这套体系在传统 BI 时代成立,但在 Agent 时代会迅速失效。

因为 Agent 的本质,不是生成报表,而是参与实时业务流程。

当 AI 开始进入客服、营销、风控、运营与供应链调度时,数据实时性将从"优化项"变成"生存项"。

过去"小时级延迟"可以接受,但未来即使"分钟级延迟",在很多场景中也可能造成决策滞后。例如:

用户刚刚投诉,客服 Agent 需要实时读取订单状态;库存刚发生波动,运营 Agent 需要即时调整推荐策略;生产风险刚出现,质检 Agent 需要秒级完成判断;广告 ROI 出现异常,系统需要立即触发预算调整。AI 越深入业务流程,数据服务就越需要实时化。

因此,数据架构正在从"离线分析系统"走向"实时数据服务系统"。这不仅是技术升级,更是经营方式的变化。

因为未来真正的竞争力,不是谁拥有更多数据,而是谁能更快把数据转化为动作。

Kyligence 案例:某互联网零售企业实时运营升级

该企业此前依赖T+1数据进行运营分析,广告投放、库存优化与用户触达存在明显滞后。引入实时指标体系后,企业将订单、库存、转化率等核心指标语义化,并打通实时数据链路,实现分钟级更新与系统调用。

当用户行为或库存波动发生时,系统可由运营 Agent 实时触发策略调整,使企业从"事后优化"转向"实时干预",显著提升运营响应与转化效率。

4 API for Agent:数据服务对象,正在从"人"变成"智能体"

过去的数据系统,本质上是为人设计的。

BI 给人看报表,Dashboard 给人做分析,SQL 给人查数据。但未来,数据的主要调用者将不再是人,而是 Agent。这意味着数据接口正在发生一次结构性重构。

过去的数据 API 是"系统对系统";未来的数据 API 将变成"能力对 Agent"。

数据服务将进一步封装为 Skill、Tool、Function,成为智能体的标准能力模块。大量过去需要人工协作完成的数据工作,将被 Agent 自动执行。例如:

每天 23:00 自动汇总营收;对比同比与周趋势;识别波动超过阈值的异常;并生成原因分析与业务建议。

过去这需要数据、运营、分析多个团队协作;未来可能只需要一句自然语言指令。

而且,这已经不是未来概念,而是正在发生的现实。AI 正在重构企业的数据生产关系,而不仅仅是提升工具效率。

Kyligence 案例:某消费零售企业 Agent 化数据运营

该企业此前需要运营、数据与分析团队协作完成营收统计、同比环比分析及异常判断,流程依赖人工整理与多系统对接。引入语义化数据服务能力后,企业将核心经营指标封装为标准化"数据能力模块",支持 Agent 直接执行多步骤分析任务,如自动生成日报、趋势对比与异常归因分析。

目前,企业已实现经营简报自动生成与异常预警自动触发,大量原本依赖人工的数据分析工作由 Agent 自动完成,使数据系统从"工具系统"演进为"业务执行系统"。

5 Cost Per Query:Agent 时代,数据基础设施将重新进入"成本战争"

Kyligence 第一款企业旗舰产品 Kyligence Enterprise 企业级多维数据库,已服务众多金融、零售、制造企业,核心成果之一就是降低传统数据分析中高达100美金一次的查询成本。

在 AI 时代,在海量数据与 Agent 驱动下,"成本指标"不会下降,反而会成为更关键的约束条件。

过去企业的数据系统主要服务"人":一个分析师一天几十次查询,一个 BI 系统一天几千次访问。但 Agent 时代完全不同。Agent 不会"优化查询次数",它为了完成任务会自动拆解步骤,发起多轮查询、推理与验证。多个 Agent 并行运行后,企业的数据访问量可能呈指数级增长。

很多企业尚未意识到:AI 大规模落地后,最先承压的不是模型,而是数据基础设施。这意味着,"Cost Per Query(单次查询成本)"将重新成为数据架构的核心指标。当查询量放大百倍甚至千倍,如果成本无法下降,AI 的规模化落地将难以成立。

因此,下一阶段的数据基础设施竞争,不只是性能竞争,而是"性能、语义能力、实时性与成本效率"的综合竞争。

Kyligence 案例:某大型金融机构成本优化实践

该金融机构在引入 AI 分析能力后,Agent 在风控、经营与客户画像分析中频繁触发多轮复杂查询,导致数据仓库负载上升、计算成本快速增长。通过引入统一语义指标体系与查询优化机制,企业对高频指标进行统一建模与复用,并对多轮Agent 查询实现结果复用与聚合优化。

最终,在 Agent 调用量持续增长的情况下,实现查询成本显著下降,在支撑更高频 AI 分析的同时保持基础设施成本可控。

上述这些案例表明,企业真正需要思考的,不只是"是否接入 AI ",而是数据底座是否具备支撑 Agent 规模化调用、实时决策与持续演进的能力。否则,AI 带来的并不一定是智能升级,也可能是错误决策放大与基础设施成本失控的双重压力。

关于 Kyligence

跬智信息(Kyligence)由 Apache Kylin 创始团队于 2016 年创办,是领先的 Data+AI 公司,为企业客户提供大数据分析平台、AI 智能分析平台等相关的产品和解决方案,以 AI 赋能全民用数,帮助企业充分利用数据价值,加速数智化转型。

Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售、医疗等行业客户,包括建设银行、平安银行、浦发银行、北京银行、宁波银行、太平洋保险、中国银联、上汽、长安汽车、星巴克、安踏、李宁、阿斯利康、UBS、MetLife 等全球知名企业,并和微软、亚马逊云科技、华为、安永、德勤等达成全球合作伙伴关系。Kyligence 获得来自红点、宽带资本、顺为资本、斯道资本、Coatue、浦银国际、中金资本等机构多次投资。

相关推荐
元启数宇1 小时前
疏散指示AI实战:规范布点与路径推演全流程
人工智能·算法
钓了猫的鱼儿1 小时前
基于深度学习+AI的电梯内电动车目标检测与预警系统(Python源码+数据集+UI可视化界面+YOLOv11训练结果)
人工智能·深度学习·目标检测
沫儿笙1 小时前
安川焊接机器人弧焊节气装置
人工智能·机器人
AlloyTeamZy1 小时前
AI知多少,你真的了解 AI 吗?
人工智能·微信小程序·ai编程
kishu_iOS&AI1 小时前
NLP —— 模型优化&蒸馏案例
人工智能·自然语言处理
真上帝的左手1 小时前
19. 大数据- BI 入门-数仓实战1-数据仓库的核心逻辑与落地范式
大数据·数据仓库·bi
YOLO数据集集合1 小时前
输电线缺陷目标检测|无人机电力巡检深度学习数据集|电网线缆散股智能识别数据
人工智能·深度学习·yolo·目标检测·无人机
志栋智能1 小时前
轻量级 vs. 重平台:巡检超自动化的两种路径选择
运维·网络·人工智能·自动化
昨日之日20061 小时前
PilotTTS - 情感语音合成利器,支持方言与多情绪控制 一键整合包下载
人工智能