Apache Flink CDC (Change Data Capture) mysql Kafka

比如使用 Flink CDC , 监听mysql bin-log日志实现数据的实时同步, 发送到kafka

阿里开源的神仙工具,完美实现数据同步!#程序员阿里开源的这个神器很好很强大。阿里开源的这个神器全面超越Canal,果然在国内开源领域能干掉阿里的只有阿里自己。把数据库当中的数据同步到其他的数据源当中,用于数据的备份、容灾、分发、采集一直都是Canal的强项。但是Canal有一个局限性,就是它只能针对增量的binlog做监听,实现增量的数据同步。

而有这样的一个框架Apache Flink CDC,它不仅支持增量的数据同步,还支持存量的数据同步,同时还支持断点续传、无锁读取、并发读取等等功能。更重要的是它是分布式架构的,可以实现很好的横向扩展,不仅它的性能要比Canal高很多,更重要的是它除了像支持MySQL、TiDB、HBase、pgSQL、kafka、ES等等数据源之外,还支持很多分布式系统,比如HDFS、Iceberg等等,总之就是非常强大。

这个项目就是大名鼎鼎的FlinkCDC,Flink不用我介绍了,CDC就是data capture的意思。这个项目现在已经捐献给Apache,作为ApacheFlink的一个重要组件。如果你需要做数据同步备份等操作,FlinkCDC一定是个不二选择。

XML 复制代码
        <flink.version>1.18.0</flink.version>
        
        <!--mysql-cdc-->
        <dependency>
            <groupId>com.ververica</groupId>
            <artifactId>flink-connector-mysql-cdc</artifactId>
            <version>3.0.1</version>
        </dependency>
        
       <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-connector-kafka</artifactId>
            <version>3.0.1-1.18</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java</artifactId>
            <version>${flink.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients</artifactId>
            <version>${flink.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-table-runtime</artifactId>
            <version>${flink.version}</version>
        </dependency>
相关推荐
IT小哥哥呀1 小时前
电池制造行业数字化实施
大数据·制造·智能制造·数字化·mom·电池·信息化
Xi xi xi1 小时前
苏州唯理科技近期也正式发布了国内首款神经腕带产品
大数据·人工智能·经验分享·科技
yumgpkpm1 小时前
华为鲲鹏 Aarch64 环境下多 Oracle 、mysql数据库汇聚到Cloudera CDP7.3操作指南
大数据·数据库·mysql·华为·oracle·kafka·cloudera
UMI赋能企业2 小时前
制造业流程自动化提升生产力的全面分析
大数据·人工智能
TDengine (老段)3 小时前
TDengine 数学函数 FLOOR 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
派可数据BI可视化5 小时前
商业智能BI 浅谈数据孤岛和数据分析的发展
大数据·数据库·数据仓库·信息可视化·数据挖掘·数据分析
jiedaodezhuti5 小时前
Flink性能调优基石:资源配置与内存优化实践
大数据·flink
Lx3527 小时前
Flink窗口机制详解:如何处理无界数据流
大数据
Lx3527 小时前
深入理解Flink的流处理模型
大数据
Lx3527 小时前
Flink vs Spark Streaming:谁更适合你的实时处理需求?
大数据