AllData数据中台通过集成DolphinScheduler+Seatunnel实现SAP HANA数据库同步到Doris数据仓库

【AllData数据中台】集成开源项目 DolphinScheduler+Seatunnel,构建了可视化、高可靠的离线开发平台。

本文将完整演示 SAP HANA 数据同步到 Doris 的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。

共包含以下国内外开源组件:

(1)此次同步的数据源是 SAP HANA 内存关系型数据库 SAP HANA 是一款高性能、列式存储的内存关系型数据库管理系统(In-Memory Database);

(2)将数据完全存储在内存中而非磁盘,速度比传统数据库快10到10,000倍;

(3)专为实时数据分析和处理企业级事务(OLTP/OLAP)而设计,是新一代 SAP S/4HANA ERP 系统的核心。

产品与项目地址

https://www.sap.cn/products/data-cloud/hana/what-is-sap-hana.html

https://github.com/apache/dolphinscheduler

https://github.com/apache/seatunnel

https://github.com/alldatacenter/alldata

1、环境准备

(1)SapHana 版本:2.00
(2)Doris 版本:doris-2.0.7
(3)SeaTunnel 版本:2.3.13

2、进入数据源管理平台

(1)查看saphana 数据信息

3、进入离线开发平台

4、配置环境

(1)打开安全中心

(2)在左侧菜单选择环境管理

(3)创建环境

(4)配置 JDK
(5)配置 SeatunnelServer
(6)确定

5、创建任务

(1)打开项目管理

(2)创建项目

6、点击项目名称


(1)打开工作流定义

(2)创建工作流-找到数据集成 SEATUNNEL,拖拽到画板



(3)填写必填项
(4)页面下滑,找到脚本设置
(5)加入以下脚本内容

java 复制代码
env {
  parallelism = 1
  job.mode = "BATCH"
}

source {
  Jdbc {
    driver = com.sap.db.jdbc.Driver
    url = "jdbc:sap://32g003:39017"
    user = "SYSTEM"
    password = "Abcd1234"
    query = "SELECT EMPLOYEE_ID , NAME , DEPARTMENT  FROM employees"
  }
}

sink {
  Doris {
    fenodes = "32g006:18030"
    username = "root"
    password = "123456"
    database = "mydb"
    table = "saphana_result"
    sink.label-prefix = "test_json"
    sink.enable-2pc = "false"
    sink.enable-delete = "true"
    doris.config {
      format = "json"
      read_json_by_line = "true"
    }
  }
}

(6)点击确定保存
(7)保存工作流

(8)创建完成

(9)上线工作流

(10)暂不配置定时任务,手动触发执行

(11)运行工作流

(12)打开工作流实例

(13)查看工作流运行状态
(14)执行完成

(15)打开任务实例-可以看到任务执行完成

7、数据验证

(1)同步数据前,查看Doris,没有表

(2)同步数据后,查看Doris,自动创建saphana_result表

可快速实现 SAP HANA 内存关系数据库到 Doris 的离线同步全流程,打破SAP HANA与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。

✅️ 零代码编排:拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;

✅️ 稳定可靠:支持自动重试、告警,避免数据丢失和不一致,适合生产环境;

✅️ 全链路可视化:任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。

杭州奥零数据科技官网:http://www.aolingdata.com

相关推荐
wgzrmlrm747 小时前
mysql如何配置全文索引停用词_mysql ft_stopword_file设置
jvm·数据库·python
城数派7 小时前
2025年南京市全类别POI(55W+数据)
数据库·arcgis·信息可视化·数据分析·excel
疯狂成瘾者7 小时前
后端系统、服务稳定性里核心的指标有哪些
数据库
SPC的存折8 小时前
openEuler 24.03 MariaDB Galera 集群部署指南(cz)
linux·运维·服务器·数据库·mysql
仲芒8 小时前
[24年单独笔记] MySQL 常用的 DML 命令
数据库·笔记·mysql
SPC的存折8 小时前
MySQL 8.0 分库分表
linux·运维·服务器·数据库·mysql
蓦然乍醒8 小时前
使用 DBeaver 还原 PostgreSQL 备份文件 (.bak) 技术文档
数据库·postgresql
XDHCOM8 小时前
Redis节点故障自动恢复机制详解,如何快速抢救故障节点,确保数据不丢失?
java·数据库·redis
QCzblack8 小时前
BugKu BUUCTF ——Reverse
java·前端·数据库
cyber_两只龙宝8 小时前
【Oracle】Oracle之DQL中WHERE限制条件查询
linux·运维·数据库·云原生·oracle