cdc

Tapdata 钛铂数据

TapTalk | 圆桌实录：澳门综合度假村敏捷转型之旅，MongoDB + TapData 赋能酒店业卓越实践在刚结束的 2025 MongoDB 用户大会·香港站上，TapData 联合创始人兼 CEO 唐建法（TJ）受邀与 MongoDB 港澳企业客户经理 Keith Fok 在圆桌讨论环节，和来自澳门综合度假村的两位在酒店服务行业数字化方面深耕十余年的客户代表同台，围绕综合度假村的全旅程数字化、客户数据平台（CDP）与实时数据服务展开对谈。

超级迅猛龙

保姆级Debezium抽取SQL Server同步kafkaDebezium SQL Server连接器捕获SQL Server数据库模式中发生的行级更改。官方2.0文档：

Change Data Capture (CDC) with Kafka Connect：实时数据同步的完整指南Change Data Capture (CDC) 是一种高效的数据同步技术，能够捕获数据库的变更（插入、更新、删除）并实时传输到其他系统。结合 Kafka Connect，我们可以构建一个可靠、可扩展的 CDC 管道，实现数据库与数据湖、数据仓库或消息队列的无缝集成。

ETL 数据集成平台与数据仓库的关系及 ETL 工具推荐数字化时代企业每天都会产生海量的数据，这些数据分散在不同的系统、数据库和应用中。为了能够有效地利用这些数据，进行数据分析、商业智能决策等，ETL数据集成平台和数据仓库成为了企业数据管理架构中的关键组成部分。本文将深入探讨ETL数据集成平台与数据仓库之间的关系。

技术白皮书：Oracle GoldenGate 优势本文为技术白皮书Oracle GoldenGate 优势的翻译及阅读笔记。以下注释中GoldenGate为OGG。

ETL数据集成与数据资产的紧密关联，解锁数据价值新密码数据已然成为企业最为珍贵的资产之一。无论是传统行业巨头，还是新兴的互联网企业，都在积极挖掘数据背后所蕴含的巨大商业价值。而在这个过程中，ETL（Extract，Transform，Load）作为数据处理的关键环节，与数据资产的形成、管理和增值有着密不可可分的紧密联系。

实时数据驱动未来：谷云科技CDC实时数据集成平台新版本发布在数字化转型的浪潮中，数据已成为企业核心资产，而数据的实时流动能力正成为业务竞争力的关键。谷云科技深耕数据集成领域多年，基于对行业痛点的深刻洞察，正式推出CDC实时数据集成平台****全新版本。此次升级不仅是技术架构的重构，更是对“数据即时价值”理念的践行。

产品更新丨谷云科技ETLCloud 3月更新速递本月，我们的数据集成产品ETLCloud继续迎来多项更新，进一步提升系统的兼容性和用户体验。以下是本月更新的亮点内容：

从文件到块: 提高 Hugging Face 存储效率Hugging Face 在 Git LFS 仓库中存储了超过 30 PB 的模型、数据集和 Spaces。由于 Git 在文件级别进行存储和版本控制，任何文件的修改都需要重新上传整个文件。这在 Hub 上会产生高昂的成本，因为平均每个 Parquet 和 CSV 文件大小在 200-300 MB 之间，Safetensor 文件约 1 GB，而 GGUF 文件甚至可能超过 8 GB。设想一下，仅仅修改 GGUF 文件中的一行元数据，就需要等待数 GB 大小的文件重新上传。除了耗费用户时间和传输成本外，

flink cdc oceanbase（binlog模式）接上文：一文说清flink从编码到部署上线环境：①操作系统：阿里龙蜥 7.9（平替CentOS7.9）；②CPU：x86；③用户：root。

Flink CDC 自定义函数处理 SQLServer XML类型数据映射 doris json字段方案因业务使用SQLServer数据库，CDC同步到doris 数仓。对于SQLServer xml类型，doris没有相应的字段对应，

flink cdc各种数据库 jar下载地址flink cdc 各种数据库的jar找起来比较麻烦，偶然发现这个地址，跟大家分享。flink cdc 各种jar下载地址： https://repo1.maven.org/maven2/com/ververica/

flink SQL实现mysql source sink接上文：一文说清flink从编码到部署上线环境说明：MySQL：5.7；flink：1.14.0；hadoop：3.0.0；操作系统：CentOS 7.6；JDK：1.8.0_401。

flink实现复杂kafka数据读取接上文：一文说清flink从编码到部署上线环境说明：MySQL：5.7；flink：1.14.0；hadoop：3.0.0；操作系统：CentOS 7.6；JDK：1.8.0_401。

一文说清flink从编码到部署上线引言：目前flink的文章比较多、杂，很少有一个文章，从一个简单的例子入手，说清楚从编码、构建、部署全流程是怎么样的。所以编写本文，自己做个记录备查同时跟大家分享一下。本文以简单的mysql cdc为例展开说明。环境说明：MySQL：5.7；flink：1.14.0；hadoop：3.0.0；操作系统：CentOS 7.6；JDK：1.8.0_401。

鸿乃江边鸟

Flink CDC 使用实践以及遇到的问题最近公司在做一些业务上的架构调整，有一部分是数据从mysql采集到Starrocks，之前的一套方法是走 debezium 到 puslar 到 starrocks,这一套下来比较需要配置很多东西，而且出现问题以后，需要修改很多配置，而且现阶段问题比较多，且采集的是所有线上的数据库，维护起来很费劲。于是我们进行了采集的数据流调整，使用 Flink CDC这一套，这一套是端到端的，且采用配置化的方式，支持schema的变更，无需再多一层中间存储层。

Debezium-KafkaDatabaseHistoryKafkaDatabaseHistory类主要用来保存和恢复历史记录存储记录：在 storeRecord 方法中将数据库历史记录发送到指定的Kafka主题。恢复记录：在 recoverRecords 方法中使用Kafka消费者从指定主题中读取并处理历史记录

鸿乃江边鸟

Flink CDC 源码解析--整体流程本文基于 Flink CDC 3.2.0 最近在做了一个实时数据抽取的工作，也就是比较简单的从mysql到Starrocks的工作，其实这种有很多中实现，比如说