Dataround数据集成整库同步

Dataround支持整库同步,首先选择数据源和目的地,然后选择选择需要同步的库、表,配置源表和目标表的字段匹配关系,系统支持按照字段名或者字段顺序自动匹配,支持Insert或者Upsert写入。

设置定时运行作业或者点击立即执行

下面以同步mysql tpcds测试数据到postgres数据库为例介绍Dataround整库同步方法

  1. 创建源MySQL、目的地Postgres数据库连接。依次点击:连接管理 >> 新建连接

    填写MySQL、Postgres JDBC连接信息,例如ip、port、账号、密码,JDBC额外配置参数可以在"其他参数"项按照键值对添加

  2. 创建离线作业

    依次点击:离线作业 >> 新建批处理作业

  3. 选择源表、目标表

    选择源库、目的库,左侧全选所有源表,右侧选择每一个与之匹配的目的地表

  4. 配置字段匹配关系,即是从哪一张同步到哪一张表

    Dataround系统支持按照字段名、字段顺序自动匹配。数据写入方式支持Insert、Upsert,Upsert会根据目标数据库主键匹配,如果某条已存在则更新,如果不存在则插入

  5. 配置同步策略

    添加任务名,执行方式可选择立即执行、暂不执行和周期性执行

  6. 在作业实例里查看运行状态,可以实时看到读写、写入了多少条数据,运行时长以及详细日志

    Dataround数据集成是Dataround数据平台中的集成模块,该开源项目地址: https://github.com/dataround/dataround-link
    任何问题随时联系项目作者wechat: yuehan124

相关推荐
RestCloud3 天前
零售行业全渠道数据整合:ETL工具如何支撑精准营销?
数据仓库·etl·零售·数据处理·数据集成·数据传输·数据同步
RestCloud6 天前
TiDB 混合负载场景下的 ETL 与 CDC 实践
数据仓库·tidb·etl·cdc·数据同步·数据库传输
ApacheSeaTunnel7 天前
SeaTunnel + AI:一句“我要做什么”,能不能直接变成一份能跑的配置?
大数据·ai·开源·数据集成·seatunnel·数据同步
RestCloud7 天前
2026年数据集成三大趋势:从批处理到实时事件驱动
ai·etl·cdc·数据传输·数据同步·数据集成平台·集成平台
RestCloud12 天前
流式优先数据架构:从批量ETL到事件驱动架构的演进之路
数据仓库·etl·cdc·数据处理·数据集成·数据传输·数据同步
ApacheSeaTunnel14 天前
Apache SeaTunnel Zeta 为什么能做到“又快又稳”?
大数据·开源·数据集成·seatunnel·技术分享·数据同步
RestCloud15 天前
制造业供应链实时数据集成:从T+1到T+0的架构落地实录
架构·etl·数据同步·数据集成平台
RestCloud1 个月前
如何用ETL实现多租户数据库的数据隔离与整合
数据库·数据仓库·etl·etlcloud·数据同步·数据集成平台·数据库传输
SeaTunnel1 个月前
关于 Apache SeaTunnel 类加载器治理的一些观察与思考(欢迎讨论)
大数据·开源·apache·seatunnel·数据同步
RestCloud1 个月前
2026年数据管道可观测性:ETL监控从被动告警到主动预警
数据仓库·数据安全·etl·数据集成·数据同步·数据监控