被低估的数据底座，正在决定 AI 时代智能应用的上限

数据，在 AI 时代被讨论得越来越多。长文本是数据，沉淀的代码是数据，企业经营过程中的订单、用户、供应链、渠道、客服、财务，亦是企业重要数据。

但在这个时间点，我们仍然想强调一个容易被忽视、却越来越关键的观点：AI 越火，企业越需要重新审视数据底座，否则AI带来的可能不是效率提升，而是系统性误判风险。

过去几年，行业把大量注意力放在模型能力、参数规模、推理能力上，但真正进入企业落地后，越来越多问题在真实业务中被放大，甚至开始直接影响经营判断与执行结果：

高管询问"Q3 XX为什么下滑"，AI 生成了一份逻辑完整却方向错误的分析，可能直接导致错误资源配置决策；客服 Agent 因为知识来源不一致，对同一问题给出互相矛盾的答案，进而破坏客户信任一致性；运营 Agent 虽然能够调用大量数据，却无法真正识别"什么属于异常"，导致风险在未被识别的情况下持续放大。

外界习惯把这些问题归因于"大模型幻觉"，但在真实企业环境中，问题很多时候并不出在模型本身，而出在更底层的数据基础设施。

模型越来越像"大脑"，但企业的数据底座，才是真正决定 AI 能否"看清现实"的感官系统。如果底层数据定义混乱、指标口径不统一、知识无法沉淀、服务无法实时响应，那么再强的模型，也只能在错误信息之上生成"结构化误导"。

这也是为什么，Kyligence 提出 Data+AI 战略以来，从 Copilot 演进到 Agent 阶段，"准确、安全、可靠"始终是产品建设最核心的原则。因为企业真正需要的，从来不是"会聊天的 AI"，而是能够进入业务系统、理解业务逻辑、参与经营决策的 AI。

而这背后，本质上是一场数据基础设施的重构。

1 语义层建设 VS 宽表建设：AI 时代，长期主义开始兑现价值

语义层建设与宽表式建设，企业其实并不陌生。

过去一轮数据基建中，两种路线长期并存，本质上也是"长期主义"与"短期效率"的取舍。

宽表式建设（或场景化建设）的核心逻辑，是围绕具体业务场景快速交付。它投入相对可控、上线周期短、短期价值明显，因此在大量企业中成为主流选择。很多组织并不是不知道语义层的重要性，而是在业务压力、ROI 压力与组织协同难度下，更倾向于"先解决眼前问题"。

但问题在于，宽表天然是"面向场景"的，而不是"面向理解"的。

它可以支撑 BI 报表，却很难支撑 Agent。它可以满足固定分析，却很难支撑开放式问答。它可以解决"取数"，却无法解决"理解数据"。

过去这些问题并不明显，因为大多数数据消费行为仍然依赖专业分析师、数据团队与固定流程。但 AI 出现后，这一矛盾被瞬间放大。

因为 Agent 并不是按照"表结构"理解世界，而是按照"业务语义"理解世界。如果企业没有统一的指标定义、维度体系与业务语义，Agent 即使能访问全部数据，也依然无法真正理解业务。

这也是为什么，在 AI 时代，语义层的价值正在被重新放大。

统一语义层解决的，不只是数据治理问题，而是"业务语言"与"机器语言"的映射问题。它让 GMV、同店增长、高净值用户、异常订单、流失风险这些原本存在于业务经验中的概念，第一次能够被系统化、标准化、机器化理解。

从这个角度看，语义层不再是 BI 时代的"高级配置"，而是 Agent 时代的数据操作系统。

这也意味着，停留在宽表阶段的数据体系，在 Agent 时代会逐渐暴露出结构性能力缺口。

Kyligence 案例：某头部保险集团语义层实践

该拥有上万代理人的保险集团长期存在指标口径不统一问题，核心指标在多系统间计算方式不一致，导致分析依赖人工对齐，归因周期长达2--3天。引入 Kyligence 一站式指标平台后，企业构建统一语义层，将分散数据标准化为统一业务指标，并支持 AI 基于语义层进行自然语言查询与分析。

最终，归因分析时间缩短至20分钟，区域工单量下降约70%，一线自主用数比例提升至72%。更关键的是，企业从"依赖人工解释数据"，转向"系统自动解释业务变化"。

2 数据 + 知识 → 决策：AI 正在从"回答问题"走向"参与经营"

过去的数据系统，本质上解决的是"看见结果"。

但今天的 AI，正在进一步走向"理解原因"与"辅助决策"。这意味着，企业的数据体系正在从"数据平台"演变为"知识平台"，甚至进一步演变为"经营逻辑平台"。

很多人对 AI 的理解仍停留在"自然语言问数"，但在真实企业场景中，真正有价值的并不是"帮你查一个数"，而是：这个数意味着什么？是否异常？背后的驱动因素是什么？下一步应该如何调整？例如：

"本季度同店增长多少算健康？" "物流损耗率超过多少需要预警？" "哪些门店下滑属于季节性波动，哪些是真实经营问题？" "提升单店营收的最佳实践有哪些，分别适用于哪些前置条件？"

这些问题已经不是数据问题，而是"数据 + 行业知识 + 经营经验"的复合问题。而这也是为什么 Ontology（本体）在新一代 Data+AI 架构中越来越关键。

本体本质上是在定义"企业如何理解世界"。

指标平台则成为承载企业知识最自然的结构：指标、维度、业务规则、异常阈值、经营经验与行业规则，都可以沉淀在统一体系中。

当这些知识被结构化之后，AI 才第一次真正具备"理解业务"的能力。

未来的数据平台不再只是"数据仓库"，而是企业经营经验的数字化载体。AI 也将从"数据助手"，逐步演进为"经营协同者"。

Kyligence 案例：某连锁零售企业经营决策升级

该全国连锁零售企业此前依赖人工分析经营报表，面对门店下滑或区域差异问题时，需要多部门拉数对齐，决策周期长且口径不一致。引入语义化指标体系后，企业将同店增长、客流转化率、库存周转等核心指标统一沉淀为标准语义，并构建指标规则与阈值体系。

基于该体系，管理层可通过自然语言直接查询异常门店及原因，系统自动结合指标规则与趋势完成分析，使经营模式从"事后报表驱动"升级为"实时决策支持"。

3 数据服务的实时化：从"批处理时代"进入"实时决策时代"

很多企业的数据体系，本质上仍然停留在"昨天的世界"。

T+1 跑批、日报驱动经营，这套体系在传统 BI 时代成立，但在 Agent 时代会迅速失效。

因为 Agent 的本质，不是生成报表，而是参与实时业务流程。

当 AI 开始进入客服、营销、风控、运营与供应链调度时，数据实时性将从"优化项"变成"生存项"。

过去"小时级延迟"可以接受，但未来即使"分钟级延迟"，在很多场景中也可能造成决策滞后。例如：

用户刚刚投诉，客服 Agent 需要实时读取订单状态；库存刚发生波动，运营 Agent 需要即时调整推荐策略；生产风险刚出现，质检 Agent 需要秒级完成判断；广告 ROI 出现异常，系统需要立即触发预算调整。AI 越深入业务流程，数据服务就越需要实时化。

因此，数据架构正在从"离线分析系统"走向"实时数据服务系统"。这不仅是技术升级，更是经营方式的变化。

因为未来真正的竞争力，不是谁拥有更多数据，而是谁能更快把数据转化为动作。

Kyligence 案例：某互联网零售企业实时运营升级

该企业此前依赖T+1数据进行运营分析，广告投放、库存优化与用户触达存在明显滞后。引入实时指标体系后，企业将订单、库存、转化率等核心指标语义化，并打通实时数据链路，实现分钟级更新与系统调用。

当用户行为或库存波动发生时，系统可由运营 Agent 实时触发策略调整，使企业从"事后优化"转向"实时干预"，显著提升运营响应与转化效率。

4 API for Agent：数据服务对象，正在从"人"变成"智能体"

过去的数据系统，本质上是为人设计的。

BI 给人看报表，Dashboard 给人做分析，SQL 给人查数据。但未来，数据的主要调用者将不再是人，而是 Agent。这意味着数据接口正在发生一次结构性重构。

过去的数据 API 是"系统对系统"；未来的数据 API 将变成"能力对 Agent"。

数据服务将进一步封装为 Skill、Tool、Function，成为智能体的标准能力模块。大量过去需要人工协作完成的数据工作，将被 Agent 自动执行。例如：

每天 23:00 自动汇总营收；对比同比与周趋势；识别波动超过阈值的异常；并生成原因分析与业务建议。

过去这需要数据、运营、分析多个团队协作；未来可能只需要一句自然语言指令。

而且，这已经不是未来概念，而是正在发生的现实。AI 正在重构企业的数据生产关系，而不仅仅是提升工具效率。

Kyligence 案例：某消费零售企业 Agent 化数据运营

该企业此前需要运营、数据与分析团队协作完成营收统计、同比环比分析及异常判断，流程依赖人工整理与多系统对接。引入语义化数据服务能力后，企业将核心经营指标封装为标准化"数据能力模块"，支持 Agent 直接执行多步骤分析任务，如自动生成日报、趋势对比与异常归因分析。

目前，企业已实现经营简报自动生成与异常预警自动触发，大量原本依赖人工的数据分析工作由 Agent 自动完成，使数据系统从"工具系统"演进为"业务执行系统"。

5 Cost Per Query：Agent 时代，数据基础设施将重新进入"成本战争"

Kyligence 第一款企业旗舰产品 Kyligence Enterprise 企业级多维数据库，已服务众多金融、零售、制造企业，核心成果之一就是降低传统数据分析中高达100美金一次的查询成本。

在 AI 时代，在海量数据与 Agent 驱动下，"成本指标"不会下降，反而会成为更关键的约束条件。

过去企业的数据系统主要服务"人"：一个分析师一天几十次查询，一个 BI 系统一天几千次访问。但 Agent 时代完全不同。Agent 不会"优化查询次数"，它为了完成任务会自动拆解步骤，发起多轮查询、推理与验证。多个 Agent 并行运行后，企业的数据访问量可能呈指数级增长。

很多企业尚未意识到：AI 大规模落地后，最先承压的不是模型，而是数据基础设施。这意味着，"Cost Per Query（单次查询成本）"将重新成为数据架构的核心指标。当查询量放大百倍甚至千倍，如果成本无法下降，AI 的规模化落地将难以成立。

因此，下一阶段的数据基础设施竞争，不只是性能竞争，而是"性能、语义能力、实时性与成本效率"的综合竞争。

Kyligence 案例：某大型金融机构成本优化实践

该金融机构在引入 AI 分析能力后，Agent 在风控、经营与客户画像分析中频繁触发多轮复杂查询，导致数据仓库负载上升、计算成本快速增长。通过引入统一语义指标体系与查询优化机制，企业对高频指标进行统一建模与复用，并对多轮Agent 查询实现结果复用与聚合优化。

最终，在 Agent 调用量持续增长的情况下，实现查询成本显著下降，在支撑更高频 AI 分析的同时保持基础设施成本可控。

上述这些案例表明，企业真正需要思考的，不只是"是否接入 AI "，而是数据底座是否具备支撑 Agent 规模化调用、实时决策与持续演进的能力。否则，AI 带来的并不一定是智能升级，也可能是错误决策放大与基础设施成本失控的双重压力。

关于 Kyligence

跬智信息（Kyligence）由 Apache Kylin 创始团队于 2016 年创办，是领先的 Data+AI 公司，为企业客户提供大数据分析平台、AI 智能分析平台等相关的产品和解决方案，以 AI 赋能全民用数，帮助企业充分利用数据价值，加速数智化转型。

Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售、医疗等行业客户，包括建设银行、平安银行、浦发银行、北京银行、宁波银行、太平洋保险、中国银联、上汽、长安汽车、星巴克、安踏、李宁、阿斯利康、UBS、MetLife 等全球知名企业，并和微软、亚马逊云科技、华为、安永、德勤等达成全球合作伙伴关系。Kyligence 获得来自红点、宽带资本、顺为资本、斯道资本、Coatue、浦银国际、中金资本等机构多次投资。