Dataround数据集成整库同步

Dataround支持整库同步,首先选择数据源和目的地,然后选择选择需要同步的库、表,配置源表和目标表的字段匹配关系,系统支持按照字段名或者字段顺序自动匹配,支持Insert或者Upsert写入。

设置定时运行作业或者点击立即执行

下面以同步mysql tpcds测试数据到postgres数据库为例介绍Dataround整库同步方法

  1. 创建源MySQL、目的地Postgres数据库连接。依次点击:连接管理 >> 新建连接

    填写MySQL、Postgres JDBC连接信息,例如ip、port、账号、密码,JDBC额外配置参数可以在"其他参数"项按照键值对添加

  2. 创建离线作业

    依次点击:离线作业 >> 新建批处理作业

  3. 选择源表、目标表

    选择源库、目的库,左侧全选所有源表,右侧选择每一个与之匹配的目的地表

  4. 配置字段匹配关系,即是从哪一张同步到哪一张表

    Dataround系统支持按照字段名、字段顺序自动匹配。数据写入方式支持Insert、Upsert,Upsert会根据目标数据库主键匹配,如果某条已存在则更新,如果不存在则插入

  5. 配置同步策略

    添加任务名,执行方式可选择立即执行、暂不执行和周期性执行

  6. 在作业实例里查看运行状态,可以实时看到读写、写入了多少条数据,运行时长以及详细日志

    Dataround数据集成是Dataround数据平台中的集成模块,该开源项目地址: https://github.com/dataround/dataround-link
    任何问题随时联系项目作者wechat: yuehan124

相关推荐
SeaTunnel4 小时前
AI 让 SeaTunnel 读源码和调试过时了吗?
大数据·数据库·人工智能·apache·seatunnel·数据同步
ApacheSeaTunnel5 天前
AI 让 SeaTunnel 读源码和调试过时了吗?
大数据·ai·开源·数据集成·seatunnel·技术分享·数据同步
Irene199110 天前
数据源表到目标表的数据同步,注意事项或规则有哪些
数据同步
Irene199111 天前
(课堂笔记)PL/SQL:异常处理、数据同步、日志
oracle·异常处理·日志·数据同步
RestCloud17 天前
ETL数据质量保障:如何通过优化提升数据准确性?
数据仓库·etl·数据处理·数据传输·数据同步·数据集成平台
RestCloud24 天前
零售行业全渠道数据整合:ETL工具如何支撑精准营销?
数据仓库·etl·零售·数据处理·数据集成·数据传输·数据同步
RestCloud1 个月前
TiDB 混合负载场景下的 ETL 与 CDC 实践
数据仓库·tidb·etl·cdc·数据同步·数据库传输
ApacheSeaTunnel1 个月前
SeaTunnel + AI:一句“我要做什么”,能不能直接变成一份能跑的配置?
大数据·ai·开源·数据集成·seatunnel·数据同步
RestCloud1 个月前
2026年数据集成三大趋势:从批处理到实时事件驱动
ai·etl·cdc·数据传输·数据同步·数据集成平台·集成平台
RestCloud1 个月前
流式优先数据架构:从批量ETL到事件驱动架构的演进之路
数据仓库·etl·cdc·数据处理·数据集成·数据传输·数据同步