
数据库作为支撑数据存储与计算的关键载体,在数据要素时代的重要性愈发凸显。过去一年,全球数据库新技术、新业态、新模式不断涌现;我国数据库的应用创新工作在重点行业和领域快速推进。随着人工智能技术深刻变革,数据库与AI融合趋势愈发明显。数据库不再仅仅承担数据存算功能,更成为AI应用的关键底座。在这一变革中,我国数据库产业正在经历前所未有的质变阶段。
近日,为推动我国数据库产业自立自强高质量发展,"2025 可信数据库发展大会(TDBC 2025)"在北京隆重召开。TapData 创始人兼 CEO 唐建法(TJ),出席数据库生态及国际化论坛并以**"TapData:支持信创数据库的实复制及实时服务平台"**为主题展开分享。TJ 指出,数据孤岛已成为企业数字化和AI发展进程中的最大瓶颈,并深入剖析了当前主流数据平台的解决方案。唐建法重点介绍了 TapData 的核心技术能力、典型应用场景及成功案例,展现了实时数据平台在打破数据孤岛、助力业务创新中的关键价值。
以下是本次分享的主要内容:
数据孤岛仍是企业数字化和 AI 转型的最大瓶颈
尽管众多企业正积极推进数字化转型,但"数据孤岛"问题仍普遍存在。表现在三方面:
-
业务流程优化困难:系统割裂,数据无法贯通,流程无法闭环;
-
信息不完整、缺乏洞察:管理层决策被迫依赖主观经验;
-
阻碍业务创新:数据未能及时为新业务所用,抑制了尝试与试错。
在 AI 驱动逐步成为共识的当下,数据无法流动成为企业通往智能化的第一道坎。
企业普遍采用的"定时采集 + 批处理"模式,已难以满足实时场景需求
当下大多数数据平台仍采用定时采集 + 批处理的方式运行,虽然架构成熟,但在面对以下需求时显得力不从心:
-
需要秒级延迟响应的在线业务;
-
多个数据源异构,字段结构复杂;
-
业务要求"拉通视图"并快速建模,供实时决策或服务系统调用。
在这类场景中,传统平台架构常常滞后,成为瓶颈。
主流实时集成方案各有利弊,"理想型架构"始终难产
企业在尝试升级架构时,常见三种选择:
-
点对点连接:开发快,但系统间耦合高、扩展性差;
-
ESB 总线方案:设计先进、文档完备,但实际部署复杂,运维成本高;
-
消息队列(如 Kafka):高性能、支持解耦,但难以胜任 ETL、建模、数据服务等通用场景。

现实往往是:"既要上手要快、又要未来要稳、投入还要轻"------这就是企业对现代数据平台的"全要型"诉求。
TapData:从采集到服务的一体化实时数据平台
正是在这样的背景下,TapData Live Data Platform 应运而生。它以一个统一的平台实现从实时数据采集、建模处理,到数据服务输出的全链路闭环。主要组件包括:
-
TapCDC:无需编码,支持数十种数据库的日志级 CDC 采集,已覆盖主流国产数据库(如达梦、金仓、南大通用、GaussDB);
-
TapFlow:对采集事件进行流式处理,支持字段转换、多表合并、增量物化视图等建模能力;
-
TapStore:嵌入式 JSON 存储层,缓存高频热点数据,支撑实时查询;
-
TapService:支持数据以 API 或订阅形式提供服务,实现 Push/Pull 式调用,便于下游对接。
这一整套架构实现了"开发门槛低、部署灵活、性能实时"的产品目标,是信创场景下替代传统方案的强力选项。
三大核心技术能力:TapData 如何保障"实时、安全、可信"的数据流通?
在平台能力层面,TapData 之所以能够胜任高频变更、异构接入和服务化输出等复杂任务,根本在于其扎实的三大核心技术能力:
无代码实时采集
TapData 通过内置的 CDC 引擎支持基于日志的非侵入式采集,兼容 60+ 数据源类型。凭借优化的变更感知机制,采集延迟可控制在 500ms 到 3 秒之间,真正做到对源系统"零负担、零代码"的采集链路构建。
-
适配主流商业数据库、国产数据库及云数据库;
-
无需写代码、无需改动业务系统;
-
快速上线,具备试点友好性。
实时物化视图
不仅能采集数据,还能"以流驱动建模"。TapData 支持构建实时物化视图,实现:
-
多表实时合并:如订单+明细+物流信息合一;
-
多源实时融合:如 PG + MongoDB + SQL Server 的数据一致视图;
-
异构实时建模:自动字段标准化与关系匹配,支持不同系统输出对齐。
这让企业可构建"统一客户视图""实时库存快照""患者全流程记录"等复杂视图结构,并实时驱动业务。
数据一致性保障
在生产级环境中,数据一致性始终是红线。TapData 提供:
-
精细化延迟监控 :全链路指标监控,精确至毫秒级别;
-
实时增量校验:确保源库与目标库一致,提升数据可信度。
这使得 TapData 在医疗、金融等高合规行业也能稳定运行,为核心业务系统提供数据支持。
支持信创数据库的无代码 CDC 采集

TapData 的核心技术能力集中体现在 TapCDC 模块。它具备对多种数据库的日志解析与结构适配能力,能够在不依赖源端业务改造的前提下实现增量数据捕获。在信创环境中,它已成功支持如:达梦数据库(Dameng)、华为 GaussDB、南大通用(GBase)、金仓数据库(KingbaseES)等主流国产数据库。

这意味着 TapData 可以作为"信创数据库生态的连接枢纽",在国产数据库彼此之间,或国产与传统数据库之间,建立标准化、实时化的同步通道。
TapFlow:流式建模与实时视图构建能力

实时性不仅限于数据搬运,更关键的是业务上下文的建模处理。TapFlow 支持:
-
多表合并逻辑;
-
条件字段过滤;
-
实时增量物化视图;
-
数据结构重构和服务输出适配。
这些能力对于企业构建"统一客户视图""患者主数据""实时库存状态"等高敏捷性应用至关重要。
典型场景实践一:Kafka ETL 替代,构建实时数据同步链路

在某头部内容平台的案例中,客户处于快速业务演进期,频繁推出新模块和新服务,对 CRM、订单、会员等多个业务系统的数据实时性要求极高。
原有挑战:
-
微服务架构下,各业务系统数据库独立,数据孤岛严重;
-
内部尝试基于 Kafka 构建链路,但开发周期长、技术门槛高、链路维护成本高;
-
每项新需求都需新写一套采集逻辑,无法快速响应业务节奏。
TapData 的解决方案:
企业经过验证测试后,引入 TapData 实时数据平台,作为 Kafka 架构的替代方案:
-
由业务团队直接对接源端数据库(如 ERP、CRM、留言系统等),采集变更数据;
-
通过 TapCDC 构建统一"镜像层",记录所有数据历史与变更;
-
利用 TapFlow 完成流式处理与建模,推送至多个新业务系统,包括推荐系统、BI报表、APP商城等;
-
所有流程采用低代码配置+可视化操作,大幅降低了数据平台的技术门槛。
落地效果与业务价值:
-
一年内创建近 200 条实时数据链路,支撑商品上新、订单显示、留言审核、会员更新等业务场景;
-
研发与维护成本大大压缩,无需再为每条链路编写 Kafka 消费程序;
-
为企业节省了约 3 人/年的开发与运维投入;
-
通过 TapData 镜像层解耦源系统,有效缓解数据库读压力,提升业务系统稳定性。
该案例表明:相比重开发、高成本、难维护的 Kafka 方案,TapData 提供了一种更轻量、更敏捷、可持续演进的企业级实时数据交换路径,尤其适合处于业务快速增长阶段的平台型企业。
典型场景实践二:实时数据服务,ESB 方案替代

以零售行业为例,企业常面临渠道分散、系统孤立、数据交付慢的问题。某大型零售客户采用 TapData 构建统一客户数据平台的实践经验,该项目成功实现了多系统聚合 + 增量建模 + 实时服务输出的业务目标。
业务背景与挑战:
-
企业内部存在 9 套 Oracle ERP 系统,分别负责不同区域门店、仓储与商品管理;
-
由于源系统数据格式各异,字段结构不统一,导致跨系统的商品、库存、价格信息难以集中维护;
-
新业务系统开发每次都需重复做数据对接,API 开发进度受限,交付周期动辄数周甚至数月。
TapData 的解决方案:
TapData 基于"增量数据驱动 + 数据建模 + 服务化输出"的架构,帮助企业快速搭建统一数据服务平台:
-
利用 TapCDC 实时采集多套 Oracle 系统中的核心业务表(如商品、库存、价格、订单等);
-
借助 TapFlow 构建主数据模型和应用数据模型,生成统一结构的物化视图;
-
通过 TapStore 缓存热数据,实现高性能数据服务;
-
由 TapService 输出标准化 API(如
/api/v1/product
、/inventory
、/orders
等),供前台系统、APP、电商平台、BI 工具等灵活调用。
落地效果与业务价值:
-
实现了商品、库存等全渠道数据的一体化服务;
-
将 API 接口从原来"逐条写"的方式转为"拖拉拽建模 + 自动发布";
-
接口交付周期从数周压缩到数日,极大提升了开发效率;
-
已有5 个业务系统接入该平台,成为企业核心数据资产平台的组成部分;
-
支持数据的可复用、可共享、可累积增长,为企业下一阶段的数据中台/API平台建设打下基础。
典型场景实践三:为 43 家医院构建统一患者主数据平台
医疗行业对数据的一致性、实时性与系统间协同有极高要求。在实际项目中,TapData 成功服务了一个拥有 43 家医院、120 多个诊所、数十套信息系统的医疗管理机构,帮助其构建了覆盖整个患者生命周期的实时数据服务平台。

原有困境:
-
原有依赖 ETL 执行每日定时任务,存在数千条链路维护成本;
-
多套 HIS、LIS、PMS、OPAS 系统之间标准不一,字段异构严重;
-
曾尝试引入 ESB 进行统一数据交换,但实施进度缓慢,实时性始终无法保障。
TapData 解决方案:
为突破上述限制,TapData 以最小资源投入为起点,快速部署了实时患者主数据平台:
-
使用 6 台服务器部署 TapData 平台,完成数据采集、建模、服务全链路;
-
TapCDC 实时采集来自 Sybase、PostgreSQL、Oracle 等系统中的门诊、住院、预约、影像、病例等诊疗数据;
-
TapFlow 将异构结构标准化处理,构建患者、病例、预约等主题模型,支持实时增量物化;
-
TapService 提供 API 与推送机制,为数十个下游系统(AI 模型、指挥平台、数据报表、移动端等)提供统一的数据出口。
最终实现了"数据一次采集,多点复用,统一服务"的治理目标。
落地效果与业务价值:
-
项目上线周期缩短至数周,实现 低成本试点 + 快速验证;
-
支持业务系统从"日级同步"升级为"分钟级甚至秒级"更新,真正满足患者数据的服务化诉求;
-
新需求数据交付从数周压缩至数日以内,业务联动响应能力大幅提升;
-
构建了可持续扩展的数据资产基础,具备 AI 分析与分级诊疗支持潜力。
结语:信创数据库生态的实时连接器,从 TapData 开始
在信创数据库技术体系日益繁荣的背景下,"连接"与"服务"成为生态繁荣的关键要素。TapData 正是以一体化的数据枢纽架构,打破数据孤岛、链接异构系统、提升业务响应效率,成为 Kafka 与 ESB 之外更适合国产数据库环境的核心平台。