使用Flinkcdc 采集mysql数据

(1)登录官网下载

https://github.com/apache/flink-cdc/releases

(1)或者虚拟机在线下载

wget https://repo1.maven.org/maven2/com/ververica/flink-sql-connector-mysql-cdc/2.2.1/flink-sql-connector-mysql-cdc-2.2.1.jar

(2)将下载的 JAR 文件放到 Flink 集群的 lib/ 目录 中,重启flink集群。

shell 复制代码
[root@node1 ~]# cd /export/server/flink
[root@node1 flink]# bin/start-cluster.sh

2.创建mysql表和数据

sql 复制代码
Drop database if exists test;
Create database test character set utf8;
Use test;
--建表语句:
-- 建表
-- 学生表
CREATE TABLE `Student`(
      `s_id` VARCHAR(20),
      `s_name` VARCHAR(20) NOT NULL DEFAULT '',
      `s_birth` VARCHAR(20) NOT NULL DEFAULT '',
      `s_sex` VARCHAR(10) NOT NULL DEFAULT '',
      PRIMARY KEY(`s_id`)
);
-- 成绩表
CREATE TABLE `Score`(
    `s_id` VARCHAR(20),
    `c_id` VARCHAR(20),
    `s_score` INT(3),
    PRIMARY KEY(`s_id`,`c_id`)
);
-- 插入学生表测试数据
insert into Student values('01' , '赵雷' , '1990-01-01' , '男');
insert into Student values('02' , '钱电' , '1990-12-21' , '男');
insert into Student values('03' , '孙风' , '1990-05-20' , '男');
insert into Student values('04' , '李云' , '1990-08-06' , '男');
insert into Student values('05' , '周梅' , '1991-12-01' , '女');
insert into Student values('06' , '吴兰' , '1992-03-01' , '女');
insert into Student values('07' , '郑竹' , '1989-07-01' , '女');
insert into Student values('08' , '王菊' , '1990-01-20' , '女');
-- 成绩表测试数据
insert into Score values('01' , '01' , 80);
insert into Score values('01' , '02' , 90);
insert into Score values('01' , '03' , 99);
insert into Score values('02' , '01' , 70);
insert into Score values('02' , '02' , 60);
insert into Score values('02' , '03' , 80);
insert into Score values('03' , '01' , 80);
insert into Score values('03' , '02' , 80);
insert into Score values('03' , '03' , 80);
insert into Score values('04' , '01' , 50);
insert into Score values('04' , '02' , 30);
insert into Score values('04' , '03' , 20);
insert into Score values('05' , '01' , 76);
insert into Score values('05' , '02' , 87);
insert into Score values('06' , '01' , 31);
insert into Score values('06' , '03' , 34);
insert into Score values('07' , '02' , 89);
insert into Score values('07' , '03' , 98);

!!!注意:开启 binlog 日志功能,如果已开启忽略如下对mysql的配置操作,直接编辑flink sql即可

验证 MySQL 配置: Flink CDC 依赖 MySQL 的 binlog 功能进行数据采集。确保 binlog 已开启,执行以下命令检查:

sql 复制代码
[root@node1 ~]# mysql -uroot -p

在mysql里面执行,如果返回值为 OFF,需要开启 binlog 功能;
SHOW VARIABLES LIKE 'log_bin';

开启方式:

shell 复制代码
vi /etc/my.cnf
在[mysqld]下面增加如下代码:
server_id=1
log_bin = mysql-bin
binlog_format = ROW
expire_logs_days = 30

解释:

server_id=1 # MySQL 实例唯一标识符,必须是唯一的

log_bin = mysql-bin # 开启 binlog 功能,文件名为 mysql-bin

binlog_format = ROW # 设置 binlog 格式为 ROW,必需

expire_logs_days = 30 # binlog 日志保留天数,自动清理超过30天的日志

然后重启 MySQL 服务:

shell 复制代码
systemctl restart mysqld

====================================

启动flink sql客户端

sql 复制代码
sql-client.sh

在FlinkSQL-Client,执行创建表 mysql_cdc_to_test_Student

sql 复制代码
CREATE TABLE if not exists mysql_cdc_to_test_Student (
     s_id     STRING,
     s_name   STRING,
     s_birth  STRING,
     s_sex    STRING,
     PRIMARY KEY (`s_id`) NOT ENFORCED
) WITH (
    'connector'= 'mysql-cdc',
    'hostname'= '192.168.77.161',
    'port'= '3306',
    'username'= 'root',
    'password'='123456',
    'server-time-zone'= 'Asia/Shanghai',
    'debezium.snapshot.mode'='initial',
    'database-name'= 'test',
    'table-name'= 'Student'
);

#设置以表形式查看
SET sql-client.execution.result-mode = tableau;

select * from mysql_cdc_to_test_Student;
相关推荐
我有医保我先冲6 小时前
SQL复杂查询与性能优化:医药行业ERP系统实战指南
数据库·sql·性能优化
说私域7 小时前
基于开源AI大模型与S2B2C模式的线下服务型门店增长策略研究——以AI智能名片与小程序源码技术为核心
大数据·人工智能·小程序·开源
阳光_你好7 小时前
详细说明Qt 中共享内存方法: QSharedMemory 对象
开发语言·数据库·qt
V_HY147627 小时前
AI碰一碰发视频获客工具,系统开发逻辑详细解析
大数据·人工智能·新媒体运营·流量运营
遇码7 小时前
单机快速部署开源、免费的分布式任务调度系统——DolphinScheduler
大数据·运维·分布式·开源·定时任务·dolphin·scheduler
喝醉酒的小白8 小时前
MySQL响应慢是否由堵塞或死锁引起?
数据库
Pasregret8 小时前
04-深入解析 Spring 事务管理原理及源码
java·数据库·后端·spring·oracle
一个天蝎座 白勺 程序猿8 小时前
大数据(4.2)Hive核心操作实战指南:表创建、数据加载与分区/分桶设计深度解析
大数据·hive·hadoop
jnrjian8 小时前
归档重做日志archived log (明显) 比redo log重做日志文件小
数据库·oracle
计算机毕设定制辅导-无忧学长8 小时前
TDengine 核心概念与时序数据模型深度解析(一)
大数据·时序数据库·tdengine