高效同步!离线开发平台(DolphinScheduler) 实现Apache IotDB物联网数据同步到 Doris

【AllData数据中台】集成开源项目 DolphinScheduler,构建了可视化、高可靠的离线开发平台。

本文将完整演示Apache IOTDB数据同步到 Doris的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。

共包含以下国内外开源组件:
1、开源项目

1.1 apache iotdb开源项目

1.2 apache dolphinscheduler开源项目

1.3 apache seatunnel开源项目

1.4 alldatacenter alldata开源项目

2、开源项目地址

2.1 https://github.com/apache/iotdb

2.2 https://github.com/apache/dolphinscheduler

2.3 https://github.com/apache/seatunnel

2.4 https://github.com/alldatacenter/alldata

一、环境准备

● iotdb 版本:1.3.0

● Doris 版本:doris-2.0.7

● SeaTunnel 版本:2.3.13

二、进入数据源管理平台

1、iotdb数据信息

2、创建Doris库表(无需操作,自动建表)

● 此时还未同步数据,doris中无相关表结构

三、进入离线开发平台

四、配置环境

1、打开安全中心

2、在左侧菜单选择环境管理

3、创建环境

● 配置 JDK

● 配置 SeatunnelServer

● 确定

五、创建任务

1、打开项目管理

2、创建项目

六、点击项目名称


1、打开工作流定义

2、创建工作流

● 找到数据集成 SEATUNNEL,拖拽到画板


● 填写必填项

● 页面下滑,找到脚本设置

● 加入以下脚本内容

java 复制代码
env {
  parallelism = 2
  job.mode = "BATCH"
}

source {
  IoTDB {
    node_urls = "32g006:26667"
    username = "root"
    password = "root"
    sql = "select status, hardware from root.ln.wf02.wt02"
    schema {
      fields {
        ts = timestamp
        status = boolean
        hardware = string
      }
    }
  }
}

sink {
  Doris {
    fenodes = "32g006:18030"
    username = "root"
    password = "123456"
    database = "mydb"
    table = "iotdb_result"
    sink.label-prefix = "test_json"
    sink.enable-2pc = "false"
    sink.enable-delete = "true"
    doris.config {
      format = "json"
      read_json_by_line = "true"
    }
    save_mode_create_template = """
      CREATE TABLE IF NOT EXISTS `${database}`.`${table}` (
        `ts` DATETIMEV2 NULL,
        `status` BOOLEAN,
        `hardware` STRING
      ) ENGINE=OLAP
      DUPLICATE KEY(`ts`)
      DISTRIBUTED BY HASH(`ts`) BUCKETS 8
      PROPERTIES (
        "replication_num" = "1"
      )
    """
  }
}

● 点击确定保存

3、保存工作流

● 创建完成

4、上线工作流

● 暂不配置定时任务,手动触发执行

5、运行工作流

6、打开工作流实例

● 查看工作流运行状态

● 执行完成

7、打开任务实例

● 可以看到任务执行完成

七、数据验证

1、同步数据前,查看Doris,没有数据库/表

2、同步数据后,查看Doris,自动创建mydb数据库,iotdb_result表

可快速实现IOTDB数据到Doris的离线同步全流程,打破IOTDB与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。

✅️零代码编排:

拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;

✅️ 稳定可靠:

支持自动重试、告警,避免数据丢失和不一致,适合生产环境;

✅️ 全链路可视化:

任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。

杭州奥零数据科技官网:http://www.aolingdata.com

相关推荐
何中应1 天前
Doris部署&连接
大数据·数据库·时序数据库·doris
Zhu7582 天前
【容器镜像打包】Apache Seatunnel打包容器镜像
apache
Zhu7582 天前
【软件部署】用docker部署Apache Kafka 集群架构isolated模式带SSL
docker·kafka·apache
xcLeigh2 天前
IoTDB数据订阅API实战:实时消费数据+TsFile订阅全攻略
数据库·api·iotdb·数据备份·tsfile·数据订阅
一个天蝎座 白勺 程序猿2 天前
Apache IoTDB(16):时序数据库的数据删除从单点精准清除到企业级数据生命周期管理
数据库·apache·时序数据库·iotdb
Zhu7582 天前
【软件部署】用docker部署Apache Kafka 集群架构的isolated模式
docker·kafka·apache
一个天蝎座 白勺 程序猿3 天前
Apache IoTDB(15):IoTDB查询写回(INTO子句)深度解析——从语法到实战的ETL全链路指南
数据库·apache·etl·iotdb
微学AI3 天前
2026年时序数据库选型指南:Apache IoTDB从大数据与物联网视角深度剖析
apache·时序数据库·iotdb
Apache IoTDB4 天前
【应用案例】电价“先知”!IoTDB 结合 AI 能力,实现电价精准预测
人工智能·iotdb
路baby4 天前
Pikachu安装过程中常见问题(apache和MySQL无法正常启动)
计算机网络·mysql·网络安全·adb·靶场·apache·pikachu