AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程

摘要:介绍数据同步平台(Seatunnel-Web):MySQL 同步至 Dori 的部署安装流程、添加数据源的具体操作、创建同步任务的步骤以及运行任务的方法。AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程。

AIIData数据中台-数据同步平台(SeaTunnel-Web)用户无需编写复杂代码即可快速配置数据同步任务,支持字段映射、转换规则设置及调度策略定义,满足离线全量、增量及实时同步等多种场景需求。

通过集中化的数据源管理模块,用户可统一管理所有连接配置,实时验证连通状态,大幅提升运维效率。

一. 环境准备

1.SeatunnelServer

安装包下载链接:https://archive.apache.org/dist/seatunnel/2.3.8/

2. 下载完成后解压到服务器

3. 配置环境变量

4. 添加以下信息

5. 使配置生效

6. 进入 SEATUNNEL_HOME 目录

7. 下载连接器,执行以下命令

8. 下载完成,查看连接器

  1. 获取 mysql jdbc 连接驱动,并上传${SEATUNNEL_HOME}/plugins 目录下

・下载链接: (如需要网盘链接,联系市场总监获取)

二. 打开数据同步平台


三. 添加数据源

1. MySQL

・点击创建

・选择JDBC-Mysql传统数据库

・编辑连接信息,点击测试连接

・点击确认

2. Doris

・点击创建

・选择Doris 传统数据库

・编辑连接信息,点击测试连接

・点击确定

四. 创建同步任务

1. 创建任务

・打开同步任务页面

・创建同步任务

・编辑任务名称,选择业务模型,点击确认

2. 创建Source

・拖拽数据源 Source 到中心工作区,并双击

・编辑 Source 信息

・查看数据模型

・点击确定

3. 创建Sink

・拖拽数据源 Sink 到中心工作区,并将 Source 连 接到 Sink,注意,要从 Source 开始,Sink 结束

・双击 Sink,编辑连接信息,点击确定

4. 配置任务信息

・打开任务设置

・选择工作模式,下滑到下方位置,点击确定

・点击保存

五. 运行任务

・ 点击运行

・查看任务运行状态

・ 同步完成

六. 数据验证

・应同步数据

・同步数据前

优势总结

高性能:分布式架构支持海量数据同步,每日可稳定处理数百亿条记录;

灵活性:兼容离线、实时、全量、增量等多种场景,满足复杂业务需求;

易用性:提供Web界面和可视化配置,降低操作门槛,支持快速部署和运维。

相关推荐
脑子进水养啥鱼?7 小时前
PostgreSQL .history 文件
数据库·postgresql
倔强的石头_7 小时前
5 个真实案例带你避坑:DolphinDB 实时写入、流订阅与高可用调优
数据库
虹科网络安全7 小时前
艾体宝新闻|Redis 月度更新速览:2026 年 3 月
数据库·redis·缓存
Nturmoils7 小时前
DolphinDB 实时时序数据处理踩坑实录:5 类生产故障排查与优化
数据库
a1117768 小时前
MonoGS 在 Jetson Orin Nano 上的部署与性能测试
python·开源·torch·cv
csdn2015_8 小时前
postgresql 拼接字段
数据库
\xin8 小时前
pikachu自编SQL(POST)
java·数据库·sql
oldking呐呐8 小时前
MySQL从建库到删库跑路 -- 4.表的操作
后端·mysql
2301_815901978 小时前
SQL如何将多行记录聚合成逗号分隔字符串_GROUP_CONCAT技巧
jvm·数据库·python
秋98 小时前
Kingbase下载、安装和使用详解
数据库