TapData 出席 TDBC 2025 可信数据库发展大会,分享“实时+信创”时代的数据基础设施演进路径

数据库作为支撑数据存储与计算的关键载体,在数据要素时代的重要性愈发凸显。过去一年,全球数据库新技术、新业态、新模式不断涌现;我国数据库的应用创新工作在重点行业和领域快速推进。随着人工智能技术深刻变革,数据库与AI融合趋势愈发明显。数据库不再仅仅承担数据存算功能,更成为AI应用的关键底座。在这一变革中,我国数据库产业正在经历前所未有的质变阶段。

近日,为推动我国数据库产业自立自强高质量发展,"2025 可信数据库发展大会(TDBC 2025)"在北京隆重召开。TapData 创始人兼 CEO 唐建法(TJ),出席数据库生态及国际化论坛并以**"TapData:支持信创数据库的实复制及实时服务平台"**为主题展开分享。TJ 指出,数据孤岛已成为企业数字化和AI发展进程中的最大瓶颈,并深入剖析了当前主流数据平台的解决方案。唐建法重点介绍了 TapData 的核心技术能力、典型应用场景及成功案例,展现了实时数据平台在打破数据孤岛、助力业务创新中的关键价值。

以下是本次分享的主要内容:

数据孤岛仍是企业数字化和 AI 转型的最大瓶颈

尽管众多企业正积极推进数字化转型,但"数据孤岛"问题仍普遍存在。表现在三方面:

  • 业务流程优化困难:系统割裂,数据无法贯通,流程无法闭环;

  • 信息不完整、缺乏洞察:管理层决策被迫依赖主观经验;

  • 阻碍业务创新:数据未能及时为新业务所用,抑制了尝试与试错。

在 AI 驱动逐步成为共识的当下,数据无法流动成为企业通往智能化的第一道坎。

企业普遍采用的"定时采集 + 批处理"模式,已难以满足实时场景需求

当下大多数数据平台仍采用定时采集 + 批处理的方式运行,虽然架构成熟,但在面对以下需求时显得力不从心:

  • 需要秒级延迟响应的在线业务;

  • 多个数据源异构,字段结构复杂;

  • 业务要求"拉通视图"并快速建模,供实时决策或服务系统调用。

在这类场景中,传统平台架构常常滞后,成为瓶颈。

主流实时集成方案各有利弊,"理想型架构"始终难产

企业在尝试升级架构时,常见三种选择:

  • 点对点连接:开发快,但系统间耦合高、扩展性差;

  • ESB 总线方案:设计先进、文档完备,但实际部署复杂,运维成本高;

  • 消息队列(如 Kafka):高性能、支持解耦,但难以胜任 ETL、建模、数据服务等通用场景。

现实往往是:"既要上手要快、又要未来要稳、投入还要轻"------这就是企业对现代数据平台的"全要型"诉求。

TapData:从采集到服务的一体化实时数据平台

正是在这样的背景下,TapData Live Data Platform 应运而生。它以一个统一的平台实现从实时数据采集、建模处理,到数据服务输出的全链路闭环。主要组件包括:

  • TapCDC:无需编码,支持数十种数据库的日志级 CDC 采集,已覆盖主流国产数据库(如达梦、金仓、南大通用、GaussDB);

  • TapFlow:对采集事件进行流式处理,支持字段转换、多表合并、增量物化视图等建模能力;

  • TapStore:嵌入式 JSON 存储层,缓存高频热点数据,支撑实时查询;

  • TapService:支持数据以 API 或订阅形式提供服务,实现 Push/Pull 式调用,便于下游对接。

这一整套架构实现了"开发门槛低、部署灵活、性能实时"的产品目标,是信创场景下替代传统方案的强力选项。

三大核心技术能力:TapData 如何保障"实时、安全、可信"的数据流通?

在平台能力层面,TapData 之所以能够胜任高频变更、异构接入和服务化输出等复杂任务,根本在于其扎实的三大核心技术能力:

无代码实时采集

TapData 通过内置的 CDC 引擎支持基于日志的非侵入式采集,兼容 60+ 数据源类型。凭借优化的变更感知机制,采集延迟可控制在 500ms 到 3 秒之间,真正做到对源系统"零负担、零代码"的采集链路构建。

  • 适配主流商业数据库、国产数据库及云数据库;

  • 无需写代码、无需改动业务系统;

  • 快速上线,具备试点友好性。

实时物化视图

不仅能采集数据,还能"以流驱动建模"。TapData 支持构建实时物化视图,实现:

  • 多表实时合并:如订单+明细+物流信息合一;

  • 多源实时融合:如 PG + MongoDB + SQL Server 的数据一致视图;

  • 异构实时建模:自动字段标准化与关系匹配,支持不同系统输出对齐。

这让企业可构建"统一客户视图""实时库存快照""患者全流程记录"等复杂视图结构,并实时驱动业务。

数据一致性保障

在生产级环境中,数据一致性始终是红线。TapData 提供:

  • 精细化延迟监控 :全链路指标监控,精确至毫秒级别

  • 实时增量校验:确保源库与目标库一致,提升数据可信度。

这使得 TapData 在医疗、金融等高合规行业也能稳定运行,为核心业务系统提供数据支持。

支持信创数据库的无代码 CDC 采集

TapData 的核心技术能力集中体现在 TapCDC 模块。它具备对多种数据库的日志解析与结构适配能力,能够在不依赖源端业务改造的前提下实现增量数据捕获。在信创环境中,它已成功支持如:达梦数据库(Dameng)、华为 GaussDB、南大通用(GBase)、金仓数据库(KingbaseES)等主流国产数据库。

这意味着 TapData 可以作为"信创数据库生态的连接枢纽",在国产数据库彼此之间,或国产与传统数据库之间,建立标准化、实时化的同步通道。

TapFlow:流式建模与实时视图构建能力

实时性不仅限于数据搬运,更关键的是业务上下文的建模处理。TapFlow 支持:

  • 多表合并逻辑;

  • 条件字段过滤;

  • 实时增量物化视图;

  • 数据结构重构和服务输出适配。

这些能力对于企业构建"统一客户视图""患者主数据""实时库存状态"等高敏捷性应用至关重要。

典型场景实践一:Kafka ETL 替代,构建实时数据同步链路

在某头部内容平台的案例中,客户处于快速业务演进期,频繁推出新模块和新服务,对 CRM、订单、会员等多个业务系统的数据实时性要求极高。

原有挑战:

  • 微服务架构下,各业务系统数据库独立,数据孤岛严重

  • 内部尝试基于 Kafka 构建链路,但开发周期长、技术门槛高、链路维护成本高

  • 每项新需求都需新写一套采集逻辑,无法快速响应业务节奏

TapData 的解决方案:

企业经过验证测试后,引入 TapData 实时数据平台,作为 Kafka 架构的替代方案:

  • 由业务团队直接对接源端数据库(如 ERP、CRM、留言系统等),采集变更数据;

  • 通过 TapCDC 构建统一"镜像层",记录所有数据历史与变更;

  • 利用 TapFlow 完成流式处理与建模,推送至多个新业务系统,包括推荐系统、BI报表、APP商城等;

  • 所有流程采用低代码配置+可视化操作,大幅降低了数据平台的技术门槛。

落地效果与业务价值:

  • 一年内创建近 200 条实时数据链路,支撑商品上新、订单显示、留言审核、会员更新等业务场景;

  • 研发与维护成本大大压缩,无需再为每条链路编写 Kafka 消费程序;

  • 为企业节省了约 3 人/年的开发与运维投入

  • 通过 TapData 镜像层解耦源系统,有效缓解数据库读压力,提升业务系统稳定性。

该案例表明:相比重开发、高成本、难维护的 Kafka 方案,TapData 提供了一种更轻量、更敏捷、可持续演进的企业级实时数据交换路径,尤其适合处于业务快速增长阶段的平台型企业。

典型场景实践二:实时数据服务,ESB 方案替代

以零售行业为例,企业常面临渠道分散、系统孤立、数据交付慢的问题。某大型零售客户采用 TapData 构建统一客户数据平台的实践经验,该项目成功实现了多系统聚合 + 增量建模 + 实时服务输出的业务目标。

业务背景与挑战:

  • 企业内部存在 9 套 Oracle ERP 系统,分别负责不同区域门店、仓储与商品管理;

  • 由于源系统数据格式各异,字段结构不统一,导致跨系统的商品、库存、价格信息难以集中维护;

  • 新业务系统开发每次都需重复做数据对接,API 开发进度受限,交付周期动辄数周甚至数月

TapData 的解决方案:

TapData 基于"增量数据驱动 + 数据建模 + 服务化输出"的架构,帮助企业快速搭建统一数据服务平台:

  • 利用 TapCDC 实时采集多套 Oracle 系统中的核心业务表(如商品、库存、价格、订单等);

  • 借助 TapFlow 构建主数据模型和应用数据模型,生成统一结构的物化视图

  • 通过 TapStore 缓存热数据,实现高性能数据服务;

  • 由 TapService 输出标准化 API(如 /api/v1/product/inventory/orders 等),供前台系统、APP、电商平台、BI 工具等灵活调用。

落地效果与业务价值:

  • 实现了商品、库存等全渠道数据的一体化服务

  • 将 API 接口从原来"逐条写"的方式转为"拖拉拽建模 + 自动发布";

  • 接口交付周期从数周压缩到数日,极大提升了开发效率;

  • 已有5 个业务系统接入该平台,成为企业核心数据资产平台的组成部分;

  • 支持数据的可复用、可共享、可累积增长,为企业下一阶段的数据中台/API平台建设打下基础。

典型场景实践三:为 43 家医院构建统一患者主数据平台

医疗行业对数据的一致性、实时性与系统间协同有极高要求。在实际项目中,TapData 成功服务了一个拥有 43 家医院、120 多个诊所、数十套信息系统的医疗管理机构,帮助其构建了覆盖整个患者生命周期的实时数据服务平台。

原有困境:

  • 原有依赖 ETL 执行每日定时任务,存在数千条链路维护成本;

  • 多套 HIS、LIS、PMS、OPAS 系统之间标准不一,字段异构严重;

  • 曾尝试引入 ESB 进行统一数据交换,但实施进度缓慢,实时性始终无法保障

TapData 解决方案:

为突破上述限制,TapData 以最小资源投入为起点,快速部署了实时患者主数据平台:

  • 使用 6 台服务器部署 TapData 平台,完成数据采集、建模、服务全链路;

  • TapCDC 实时采集来自 Sybase、PostgreSQL、Oracle 等系统中的门诊、住院、预约、影像、病例等诊疗数据;

  • TapFlow 将异构结构标准化处理,构建患者、病例、预约等主题模型,支持实时增量物化;

  • TapService 提供 API 与推送机制,为数十个下游系统(AI 模型、指挥平台、数据报表、移动端等)提供统一的数据出口。

最终实现了"数据一次采集,多点复用,统一服务"的治理目标。

落地效果与业务价值:

  • 项目上线周期缩短至数周,实现 低成本试点 + 快速验证

  • 支持业务系统从"日级同步"升级为"分钟级甚至秒级"更新,真正满足患者数据的服务化诉求;

  • 新需求数据交付从数周压缩至数日以内,业务联动响应能力大幅提升;

  • 构建了可持续扩展的数据资产基础,具备 AI 分析与分级诊疗支持潜力。

结语:信创数据库生态的实时连接器,从 TapData 开始

在信创数据库技术体系日益繁荣的背景下,"连接"与"服务"成为生态繁荣的关键要素。TapData 正是以一体化的数据枢纽架构,打破数据孤岛、链接异构系统、提升业务响应效率,成为 Kafka 与 ESB 之外更适合国产数据库环境的核心平台。

相关推荐
我的ID配享太庙呀1 小时前
Django 科普介绍:从入门到了解其核心魅力
数据库·后端·python·mysql·django·sqlite
不辉放弃2 小时前
kafka的消费者负载均衡机制
数据库·分布式·kafka·负载均衡
拉姆哥的小屋2 小时前
用 Flask 打造宠物店线上平台:从 0 到 1 的全栈开发实践
数据库·oracle·flask
liliangcsdn3 小时前
mac neo4j install & verifcation
数据库·neo4j
Cyanto3 小时前
MyBatis-Plus高效开发实战
java·开发语言·数据库
-XWB-4 小时前
【Oracle】套接字异常(SocketException)背后隐藏的Oracle问题:ORA-03137深度排查与解决之道
数据库·oracle
睿思达DBA_WGX4 小时前
由于主库切换归档路径导致的 Oracle DG 无法同步问题的解决过程
运维·数据库·oracle
!chen4 小时前
Oracle 19.20未知BUG导致oraagent进程内存泄漏
数据库·oracle·bug
DarkAthena5 小时前
【GaussDB】构建一个GaussDB的Docker镜像
数据库·docker·gaussdb
祁思妙想5 小时前
add新增管理员功能、BaseController类的简介--------示例OJ
数据库·windows