AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程

摘要:介绍数据同步平台(Seatunnel-Web):MySQL 同步至 Dori 的部署安装流程、添加数据源的具体操作、创建同步任务的步骤以及运行任务的方法。AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程。

AIIData数据中台-数据同步平台(SeaTunnel-Web)用户无需编写复杂代码即可快速配置数据同步任务,支持字段映射、转换规则设置及调度策略定义,满足离线全量、增量及实时同步等多种场景需求。

通过集中化的数据源管理模块,用户可统一管理所有连接配置,实时验证连通状态,大幅提升运维效率。

一. 环境准备

1.SeatunnelServer

安装包下载链接:https://archive.apache.org/dist/seatunnel/2.3.8/

2. 下载完成后解压到服务器

3. 配置环境变量

4. 添加以下信息

5. 使配置生效

6. 进入 SEATUNNEL_HOME 目录

7. 下载连接器,执行以下命令

8. 下载完成,查看连接器

  1. 获取 mysql jdbc 连接驱动,并上传${SEATUNNEL_HOME}/plugins 目录下

・下载链接: (如需要网盘链接,联系市场总监获取)

二. 打开数据同步平台


三. 添加数据源

1. MySQL

・点击创建

・选择JDBC-Mysql传统数据库

・编辑连接信息,点击测试连接

・点击确认

2. Doris

・点击创建

・选择Doris 传统数据库

・编辑连接信息,点击测试连接

・点击确定

四. 创建同步任务

1. 创建任务

・打开同步任务页面

・创建同步任务

・编辑任务名称,选择业务模型,点击确认

2. 创建Source

・拖拽数据源 Source 到中心工作区,并双击

・编辑 Source 信息

・查看数据模型

・点击确定

3. 创建Sink

・拖拽数据源 Sink 到中心工作区,并将 Source 连 接到 Sink,注意,要从 Source 开始,Sink 结束

・双击 Sink,编辑连接信息,点击确定

4. 配置任务信息

・打开任务设置

・选择工作模式,下滑到下方位置,点击确定

・点击保存

五. 运行任务

・ 点击运行

・查看任务运行状态

・ 同步完成

六. 数据验证

・应同步数据

・同步数据前

优势总结

高性能:分布式架构支持海量数据同步,每日可稳定处理数百亿条记录;

灵活性:兼容离线、实时、全量、增量等多种场景,满足复杂业务需求;

易用性:提供Web界面和可视化配置,降低操作门槛,支持快速部署和运维。

相关推荐
较劲男子汉11 分钟前
CANN Runtime零拷贝传输技术源码实战 彻底打通Host与Device的数据传输壁垒
运维·服务器·数据库·cann
java搬砖工-苤-初心不变16 分钟前
MySQL 主从复制配置完全指南:从原理到实践
数据库·mysql
大大大反派1 小时前
CANN 生态未来展望:统一框架 `CANN Unified` 与开源协同演进
开源
酷酷的崽7981 小时前
CANN 开源生态实战:端到端构建高效文本分类服务
分类·数据挖掘·开源
晚霞的不甘1 小时前
CANN 在工业质检中的亚像素级视觉检测系统设计
人工智能·计算机视觉·架构·开源·视觉检测
WangYaolove13142 小时前
基于python的在线水果销售系统(源码+文档)
python·mysql·django·毕业设计·源码
山岚的运维笔记2 小时前
SQL Server笔记 -- 第18章:Views
数据库·笔记·sql·microsoft·sqlserver
爱吃烤鸡翅的酸菜鱼3 小时前
CANN ops-nn激活函数与池化算子深度解析
网络·开源·aigc
ujainu3 小时前
CANN仓库中的AIGC可持续演进工程:昇腾AI软件栈如何构建“活”的开源生态
人工智能·开源·aigc
酷酷的崽7983 小时前
深度解析 CANN 开源项目:以 `ops-transformer` 为例探索 AI 模型加速实践
开源