clickhouse从mysql同步数据到clickhouse的几种方式

背景

我们的业务数据一般来说都是放在Mysql中的,而我们要分析的数据一般都存放在clickhouse中,所以如何把数据从mysql同步到ck,就变成了一个必须的步骤,本文简单记录下几种同步的方式

mysql数据同步到clickhouse

方式一:

在clickhouse中独立创建一个ck的表,对应着mysql的一张表数据,然后使用定时任务比如每天或者每小时从mysql中查询一天的增量或者一小时的增量数据插入到ck中,这种方式比较容易理解和实现

方式二:

使用canel+kafka同步二进制binlog的方式同步数据,具体来说是把每条db的变更转换成kafka的记录,然后消费kafka消息把数据插入到ck中

方式三:

使用ck提供的mysql引擎表

java 复制代码
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
    ...
) ENGINE = MySQL('host:port', 'database', 'table', 'user', 'password'[, replace_query, 'on_duplicate_clause'])
SETTINGS
    [ connection_pool_size=16, ]
    [ connection_max_tries=3, ]
    [ connection_wait_timeout=5, ]
    [ connection_auto_close=true, ]
    [ connect_timeout=10, ]
    [ read_write_timeout=300 ]
;

方式四:

使用ck提供的当前还处于实验阶段的MaterializedMySQL引擎

java 复制代码
CREATE DATABASE mysql ENGINE = MaterializedMySQL('localhost:3306', 'db', 'user', '***');

方式五:

通过把mysql表导出成Tsv文件,然后通过clickhouse-client工具把TSV文件的数据导入到ck的表中.

参考文献:

https://clickhouse.com/docs/zh/engines/database-engines/materialized-mysql

相关推荐
!chen5 小时前
EF Core自定义映射PostgreSQL原生函数
数据库·postgresql
霖霖总总5 小时前
[小技巧14]MySQL 8.0 系统变量设置全解析:SET GLOBAL、SET PERSIST 与 SET PERSIST_ONLY 的区别与应用
数据库·mysql
马克学长5 小时前
SSM校园食堂订餐系统531p9(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm 框架·ssm 校园食堂订餐系统
alonewolf_995 小时前
深入剖析MySQL索引底层:B+树、联合索引与跳跃扫描原理全解
数据库·b树·mysql
oMcLin5 小时前
如何在 AlmaLinux 9 上配置并优化 Redis 集群,支持高并发的实时数据缓存与快速查询?
数据库·redis·缓存
oMcLin5 小时前
如何在Debian 11上通过配置MySQL 8.0的分布式架构,提升跨区域数据同步的效率与延迟?
分布式·mysql·debian
洛阳纸贵6 小时前
Redis
数据库·redis·缓存
计算机学姐6 小时前
基于SpringBoot的校园资源共享系统【个性化推荐算法+数据可视化统计】
java·vue.js·spring boot·后端·mysql·spring·信息可视化
l1t6 小时前
DeepSeek辅助编写的利用位掩码填充唯一候选数方法求解数独SQL
数据库·sql·算法·postgresql
墨月白6 小时前
[QT] QT中的折线图和散点图
数据库·qt