Flinkcdc 实现 MySQL 写入 Doris

Flinkcdc 实现 MySQL 写入 Doris

Flinkcdc 实现 MySQL 写入 Doris

一、环境配置

Doris:3.0.4 + JDK 17

MySQL (业务数据库):5.7

MySQL(本地数据库):5.7

Flink:flink-1.19.1

flinkcdc:flink-cdc-3.3.0

二、环境搭建

  1. 下载 Flink 1.19.1
bash 复制代码
wget https://archive.apache.org/dist/flink/flink-1.19.1/flink-1.19.1-bin-scala_2.12.tgz

解压后得到 flink-1.19.1 目录,设置 FLINK_HOME 为 flink-1.19.1 所在目录

bash 复制代码
sudo vim /etc/profile.d/my_env.sh

添加 Flink 路径

html 复制代码
export JAVA_HOME=/opt/module/java
export PATH=$PATH:$JAVA_HOME/bin
export FLINK_HOME=/opt/module/flink-1.19.1
export PATH=$PATH:$FLINK_HOME/bin 
  1. 读入数据通过在 conf/flink-conf.yaml 配置文件追加下列参数开启 checkpoint,每隔 3 秒做一次 checkpoint。
c 复制代码
execution.checkpointing.interval: 3000
  1. 使用下面的命令启动 Flink 集群
bash 复制代码
./bin/start-cluster.sh

启动成功的话,可以在 http://localhost:8081/访问到 Flink Web UI,如下所示:

多次执行 start-cluster.sh 可以拉起多个 TaskManager。

部署 Doris 和 MySQL 这部分省略

添加配置文件

Flink lib 目录下:

flinkcdc 3.3.0 lib 目录下

编写任务配置 yaml 文件。 下面给出了一个整库同步的示例文件 mysql-to-doris.yaml:

bash 复制代码
################################################################################
# Description: Sync MySQL all tables to Doris
################################################################################
source:
  type: mysql
  hostname: 172.16.11.154
  port: 3306
  username: root
  password: xxx
  tables: app_db.\.*
  server-id: 5400-5404
  server-time-zone: 'Asia/Shanghai'
sink:
  type: doris
  fenodes: 172.16.10.181:8030
  benodes: 172.16.10.181:8040
  username: root
  password: 123456
  table.create.properties.light_schema_change: true
  table.create.properties.replication_num: 1
  
pipeline:
  name: Sync MySQL Database to Doris
  parallelism: 1

其中: source 中的 tables: app_db..* 通过正则匹配同步 app_db 下的所有表。 sink 添加 table.create.properties.replication_num 参数是由于 Docker 镜像中只有一个 Doris BE 节点。

最后,通过命令行提交任务到 Flink Standalone cluster

bash 复制代码
bash bin/flink-cdc.sh mysql-to-doris.yaml

提交成功后,返回信息如:

bash 复制代码
Pipeline has been submitted to cluster.
Job ID: ae30f4580f1918bebf16752d4963dc54
Job Description: Sync MySQL Database to Doris

在 Flink Web UI,可以看到一个名为 Sync MySQL Database to Doris 的任务正在运行。

后续相关信息,参考官网即可

https://nightlies.apache.org/flink/flink-cdc-docs-release-3.3/zh/docs/get-started/quickstart/mysql-to-doris/

相关推荐
java1234_小锋17 分钟前
MySQL中的乐观锁和悲观锁是什么?
mysql
用户72278681234425 分钟前
Flink源码阅读:Task数据交互
flink
齐 飞1 小时前
快速删除mysql表中所有数据-TRUNCATE TABLE
数据库·mysql
计算机学姐2 小时前
基于SpringBoot的汉服租赁系统【颜色尺码套装+个性化推荐算法+数据可视化统计】
java·vue.js·spring boot·后端·mysql·信息可视化·推荐算法
程序人生5182 小时前
宝塔安装完mysql5.7后 root无法通过远程连接问题排查
mysql·宝塔面板
alonewolf_992 小时前
深入理解MySQL事务与锁机制:从原理到实践
android·数据库·mysql
骑着bug的coder3 小时前
第11讲:主从复制与读写分离架构
后端·mysql
朝依飞3 小时前
fastapi+SQLModel + SQLAlchemy2.x+mysql
数据库·mysql·fastapi
shejizuopin4 小时前
基于JavaSSM+MySQL的实验室考勤管理系统设计与实现
java·mysql·vue·毕业设计·论文·springboot·实验室考勤管理系统设计与实现
alonewolf_994 小时前
MySQL全局优化详解与8.0新特性全面解读
数据库·mysql