clickhouse从mysql同步数据到clickhouse的几种方式

背景

我们的业务数据一般来说都是放在Mysql中的,而我们要分析的数据一般都存放在clickhouse中,所以如何把数据从mysql同步到ck,就变成了一个必须的步骤,本文简单记录下几种同步的方式

mysql数据同步到clickhouse

方式一:

在clickhouse中独立创建一个ck的表,对应着mysql的一张表数据,然后使用定时任务比如每天或者每小时从mysql中查询一天的增量或者一小时的增量数据插入到ck中,这种方式比较容易理解和实现

方式二:

使用canel+kafka同步二进制binlog的方式同步数据,具体来说是把每条db的变更转换成kafka的记录,然后消费kafka消息把数据插入到ck中

方式三:

使用ck提供的mysql引擎表

java 复制代码
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
    ...
) ENGINE = MySQL('host:port', 'database', 'table', 'user', 'password'[, replace_query, 'on_duplicate_clause'])
SETTINGS
    [ connection_pool_size=16, ]
    [ connection_max_tries=3, ]
    [ connection_wait_timeout=5, ]
    [ connection_auto_close=true, ]
    [ connect_timeout=10, ]
    [ read_write_timeout=300 ]
;

方式四:

使用ck提供的当前还处于实验阶段的MaterializedMySQL引擎

java 复制代码
CREATE DATABASE mysql ENGINE = MaterializedMySQL('localhost:3306', 'db', 'user', '***');

方式五:

通过把mysql表导出成Tsv文件,然后通过clickhouse-client工具把TSV文件的数据导入到ck的表中.

参考文献:

https://clickhouse.com/docs/zh/engines/database-engines/materialized-mysql

相关推荐
TDengine (老段)14 分钟前
开放生态破局工业大数据困局:TDengine 的迭代升级与全链路数据自由流动
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
一位代码15 分钟前
一些常用的通用 mysql 命令详解及注意事项
数据库·mysql
曹牧28 分钟前
Oracle:五笔码
数据库·oracle
苹果醋328 分钟前
JAVA设计模式之观察者模式
java·运维·spring boot·mysql·nginx
今晚务必早点睡29 分钟前
MySQL 新手避坑指南:安装、区分、检查一步到位
数据库·mysql·adb
心本无晴.30 分钟前
拣学--基于vue3和django框架实现的辅助考研系统
vue.js·python·mysql·考研·django·dify
JIngJaneIL32 分钟前
基于java+ vue畅游游戏销售管理系统(源码+数据库+文档)
java·开发语言·数据库·vue.js·spring boot·游戏
詹姆斯爱研究Java33 分钟前
基于Django的租房网站的设计与实现
数据库·python·django
deng-c-f33 分钟前
Linux C/C++ 学习日记(50):连接池
数据库·学习·连接池
运维行者_40 分钟前
APM 性能监控是什么?从应用监控与网站监控了解基础概念
网络·数据库·云原生·容器·kubernetes·智能路由器·运维开发