Apache Flink CDC (Change Data Capture) mysql Kafka

比如使用 Flink CDC , 监听mysql bin-log日志实现数据的实时同步, 发送到kafka

阿里开源的神仙工具,完美实现数据同步!#程序员阿里开源的这个神器很好很强大。阿里开源的这个神器全面超越Canal,果然在国内开源领域能干掉阿里的只有阿里自己。把数据库当中的数据同步到其他的数据源当中,用于数据的备份、容灾、分发、采集一直都是Canal的强项。但是Canal有一个局限性,就是它只能针对增量的binlog做监听,实现增量的数据同步。

而有这样的一个框架Apache Flink CDC,它不仅支持增量的数据同步,还支持存量的数据同步,同时还支持断点续传、无锁读取、并发读取等等功能。更重要的是它是分布式架构的,可以实现很好的横向扩展,不仅它的性能要比Canal高很多,更重要的是它除了像支持MySQL、TiDB、HBase、pgSQL、kafka、ES等等数据源之外,还支持很多分布式系统,比如HDFS、Iceberg等等,总之就是非常强大。

这个项目就是大名鼎鼎的FlinkCDC,Flink不用我介绍了,CDC就是data capture的意思。这个项目现在已经捐献给Apache,作为ApacheFlink的一个重要组件。如果你需要做数据同步备份等操作,FlinkCDC一定是个不二选择。

XML 复制代码
        <flink.version>1.18.0</flink.version>
        
        <!--mysql-cdc-->
        <dependency>
            <groupId>com.ververica</groupId>
            <artifactId>flink-connector-mysql-cdc</artifactId>
            <version>3.0.1</version>
        </dependency>
        
       <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-connector-kafka</artifactId>
            <version>3.0.1-1.18</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java</artifactId>
            <version>${flink.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients</artifactId>
            <version>${flink.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-table-runtime</artifactId>
            <version>${flink.version}</version>
        </dependency>
相关推荐
YangYang9YangYan6 分钟前
数据科学与大数据技术专业学习数据分析的价值
大数据·学习·数据分析
元拓数智38 分钟前
NL2SQL落地后的“隐形陷阱”:如何破解数据变更引发的查询失效难题
大数据·ai·自然语言处理·nl2sql
专注API从业者42 分钟前
告别手动翻页!基于淘宝商品接口 + Open Claw 实现自动化选品与实时监控(附完整 Python 代码)
大数据·运维·数据库·自动化
云中计算巫作坤1 小时前
多平台电商订单,手工同步的时代该结束了
大数据·系统集成·s-hub·s-hub电商平台对接
阿坤带你走近大数据1 小时前
Flink中背压的详细介绍
大数据·flink
暗夜猎手-大魔王1 小时前
hermes源码学习5-Provider 运行时解析
大数据·人工智能·学习
五度易链-区域产业数字化管理平台1 小时前
从编制规范到落地应用,新版可研报告撰写全流程指南
大数据·人工智能
lauo1 小时前
ibbot手机青春版:AI时代真正的生产力革命——从联想小新Air 13看智能设备的分水岭
大数据·人工智能·智能手机
器灵科技2 小时前
DeepSeek V4 Pro宣称:超GPT-5.5+永久降价75%
大数据·人工智能·gpt·阿里云·ai·语言模型
yyoc972 小时前
本地 Flink on K8s + Iceberg + MinIO 实时数仓平台 — AI部署指南与踩坑实录
大数据·ai·flink·kubernetes·iceberg