Dataround支持整库同步,首先选择数据源和目的地,然后选择选择需要同步的库、表,配置源表和目标表的字段匹配关系,系统支持按照字段名或者字段顺序自动匹配,支持Insert或者Upsert写入。
设置定时运行作业或者点击立即执行
下面以同步mysql tpcds测试数据到postgres数据库为例介绍Dataround整库同步方法
-
创建源MySQL、目的地Postgres数据库连接。依次点击:连接管理 >> 新建连接

填写MySQL、Postgres JDBC连接信息,例如ip、port、账号、密码,JDBC额外配置参数可以在"其他参数"项按照键值对添加

-
创建离线作业
依次点击:离线作业 >> 新建批处理作业

-
选择源表、目标表
选择源库、目的库,左侧全选所有源表,右侧选择每一个与之匹配的目的地表

-
配置字段匹配关系,即是从哪一张同步到哪一张表
Dataround系统支持按照字段名、字段顺序自动匹配。数据写入方式支持Insert、Upsert,Upsert会根据目标数据库主键匹配,如果某条已存在则更新,如果不存在则插入

-
配置同步策略
添加任务名,执行方式可选择立即执行、暂不执行和周期性执行

-
在作业实例里查看运行状态,可以实时看到读写、写入了多少条数据,运行时长以及详细日志

Dataround数据集成是Dataround数据平台中的集成模块,该开源项目地址: https://github.com/dataround/dataround-link
任何问题随时联系项目作者wechat: yuehan124