AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程

摘要:介绍数据同步平台(Seatunnel-Web):MySQL 同步至 Dori 的部署安装流程、添加数据源的具体操作、创建同步任务的步骤以及运行任务的方法。AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程。

AIIData数据中台-数据同步平台(SeaTunnel-Web)用户无需编写复杂代码即可快速配置数据同步任务,支持字段映射、转换规则设置及调度策略定义,满足离线全量、增量及实时同步等多种场景需求。

通过集中化的数据源管理模块,用户可统一管理所有连接配置,实时验证连通状态,大幅提升运维效率。

一. 环境准备

1.SeatunnelServer

安装包下载链接:https://archive.apache.org/dist/seatunnel/2.3.8/

2. 下载完成后解压到服务器

3. 配置环境变量

4. 添加以下信息

5. 使配置生效

6. 进入 SEATUNNEL_HOME 目录

7. 下载连接器,执行以下命令

8. 下载完成,查看连接器

  1. 获取 mysql jdbc 连接驱动,并上传${SEATUNNEL_HOME}/plugins 目录下

・下载链接: (如需要网盘链接,联系市场总监获取)

二. 打开数据同步平台


三. 添加数据源

1. MySQL

・点击创建

・选择JDBC-Mysql传统数据库

・编辑连接信息,点击测试连接

・点击确认

2. Doris

・点击创建

・选择Doris 传统数据库

・编辑连接信息,点击测试连接

・点击确定

四. 创建同步任务

1. 创建任务

・打开同步任务页面

・创建同步任务

・编辑任务名称,选择业务模型,点击确认

2. 创建Source

・拖拽数据源 Source 到中心工作区,并双击

・编辑 Source 信息

・查看数据模型

・点击确定

3. 创建Sink

・拖拽数据源 Sink 到中心工作区,并将 Source 连 接到 Sink,注意,要从 Source 开始,Sink 结束

・双击 Sink,编辑连接信息,点击确定

4. 配置任务信息

・打开任务设置

・选择工作模式,下滑到下方位置,点击确定

・点击保存

五. 运行任务

・ 点击运行

・查看任务运行状态

・ 同步完成

六. 数据验证

・应同步数据

・同步数据前

优势总结

高性能:分布式架构支持海量数据同步,每日可稳定处理数百亿条记录;

灵活性:兼容离线、实时、全量、增量等多种场景,满足复杂业务需求;

易用性:提供Web界面和可视化配置,降低操作门槛,支持快速部署和运维。

相关推荐
Mr.Entropy2 小时前
数据库读写分离介绍
数据库
Codeking__2 小时前
Redis的value类型及编码方式介绍——string
数据库·redis·缓存
石臻臻的杂货铺2 小时前
参数仅 1/30 却追平闭源巨头?MiroThinker 1.5 开源实测:普通人也能拥有的“顶级情报官”
开源·ai编程
前端付豪2 小时前
NodeJs 做了什么 Fundamentals Internals
前端·开源·node.js
ShuiShenHuoLe2 小时前
maven配置阿里源
java·数据库·maven
zhengfei6112 小时前
开源 OSINT 图探索工具
开源
码农爱学习2 小时前
C语言结构体对齐是怎么计算
java·c语言·数据库
小杨同学493 小时前
C 语言实战:堆内存存储字符串 + 多种递归方案计算字符串长度
数据库·后端·算法
小码编匠3 小时前
完美替代 Navicat,一款开源免费、集成了 AIGC 能力的多数据库客户端工具!
数据库·后端·aigc