AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程

摘要:介绍数据同步平台(Seatunnel-Web):MySQL 同步至 Dori 的部署安装流程、添加数据源的具体操作、创建同步任务的步骤以及运行任务的方法。AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程。

AIIData数据中台-数据同步平台(SeaTunnel-Web)用户无需编写复杂代码即可快速配置数据同步任务,支持字段映射、转换规则设置及调度策略定义,满足离线全量、增量及实时同步等多种场景需求。

通过集中化的数据源管理模块,用户可统一管理所有连接配置,实时验证连通状态,大幅提升运维效率。

一. 环境准备

1.SeatunnelServer

安装包下载链接:https://archive.apache.org/dist/seatunnel/2.3.8/

2. 下载完成后解压到服务器

3. 配置环境变量

4. 添加以下信息

5. 使配置生效

6. 进入 SEATUNNEL_HOME 目录

7. 下载连接器,执行以下命令

8. 下载完成,查看连接器

  1. 获取 mysql jdbc 连接驱动,并上传${SEATUNNEL_HOME}/plugins 目录下

・下载链接: (如需要网盘链接,联系市场总监获取)

二. 打开数据同步平台


三. 添加数据源

1. MySQL

・点击创建

・选择JDBC-Mysql传统数据库

・编辑连接信息,点击测试连接

・点击确认

2. Doris

・点击创建

・选择Doris 传统数据库

・编辑连接信息,点击测试连接

・点击确定

四. 创建同步任务

1. 创建任务

・打开同步任务页面

・创建同步任务

・编辑任务名称,选择业务模型,点击确认

2. 创建Source

・拖拽数据源 Source 到中心工作区,并双击

・编辑 Source 信息

・查看数据模型

・点击确定

3. 创建Sink

・拖拽数据源 Sink 到中心工作区,并将 Source 连 接到 Sink,注意,要从 Source 开始,Sink 结束

・双击 Sink,编辑连接信息,点击确定

4. 配置任务信息

・打开任务设置

・选择工作模式,下滑到下方位置,点击确定

・点击保存

五. 运行任务

・ 点击运行

・查看任务运行状态

・ 同步完成

六. 数据验证

・应同步数据

・同步数据前

优势总结

高性能:分布式架构支持海量数据同步,每日可稳定处理数百亿条记录;

灵活性:兼容离线、实时、全量、增量等多种场景,满足复杂业务需求;

易用性:提供Web界面和可视化配置,降低操作门槛,支持快速部署和运维。

相关推荐
heimeiyingwang2 分钟前
【架构实战】NewSQL数据库对比(TiDB/CockroachDB)
数据库·架构·tidb
buhuimaren_3 分钟前
pg日常维护
数据库·oracle
大虾别跑3 分钟前
Oracle迁移
数据库·oracle
提子拌饭1337 分钟前
星芒便签:鸿蒙Flutter框架 实现的美观便签应用
flutter·华为·架构·开源·harmonyos·鸿蒙
Trouvaille ~7 分钟前
【MySQL篇】数据库操作:从创建到管理
linux·数据库·mysql·oracle·xshell·ddl
瀚高PG实验室21 分钟前
ETL中,分区表子表未及时收集统计信息,导致sql执行耗时很长
数据库·数据仓库·sql·etl·瀚高数据库
@不误正业22 分钟前
第04章-开源鸿蒙的架构概览
架构·开源·harmonyos
独特的螺狮粉23 分钟前
开源鸿蒙跨平台Flutter开发:近视防控数字疗法:基于 Flutter 的眼动物理追踪与睫状肌动力学舒缓测绘架构
flutter·华为·架构·开源·harmonyos·鸿蒙
世人万千丶32 分钟前
Flutter 框架跨平台鸿蒙开发 - 家庭健康档案云应用
学习·flutter·华为·开源·harmonyos·鸿蒙
LDG_AGI33 分钟前
【搜索引擎】Elasticsearch(二):基于function_score的搜索排序
数据库·人工智能·深度学习·elasticsearch·机器学习·搜索引擎·推荐算法