高效同步!离线开发平台(DolphinScheduler) 实现Apache IotDB物联网数据同步到 Doris

【AllData数据中台】集成开源项目 DolphinScheduler,构建了可视化、高可靠的离线开发平台。

本文将完整演示Apache IOTDB数据同步到 Doris的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。

共包含以下国内外开源组件:
1、开源项目

1.1 apache iotdb开源项目

1.2 apache dolphinscheduler开源项目

1.3 apache seatunnel开源项目

1.4 alldatacenter alldata开源项目

2、开源项目地址

2.1 https://github.com/apache/iotdb

2.2 https://github.com/apache/dolphinscheduler

2.3 https://github.com/apache/seatunnel

2.4 https://github.com/alldatacenter/alldata

一、环境准备

● iotdb 版本:1.3.0

● Doris 版本:doris-2.0.7

● SeaTunnel 版本:2.3.13

二、进入数据源管理平台

1、iotdb数据信息

2、创建Doris库表(无需操作,自动建表)

● 此时还未同步数据,doris中无相关表结构

三、进入离线开发平台

四、配置环境

1、打开安全中心

2、在左侧菜单选择环境管理

3、创建环境

● 配置 JDK

● 配置 SeatunnelServer

● 确定

五、创建任务

1、打开项目管理

2、创建项目

六、点击项目名称


1、打开工作流定义

2、创建工作流

● 找到数据集成 SEATUNNEL,拖拽到画板


● 填写必填项

● 页面下滑,找到脚本设置

● 加入以下脚本内容

java 复制代码
env {
  parallelism = 2
  job.mode = "BATCH"
}

source {
  IoTDB {
    node_urls = "32g006:26667"
    username = "root"
    password = "root"
    sql = "select status, hardware from root.ln.wf02.wt02"
    schema {
      fields {
        ts = timestamp
        status = boolean
        hardware = string
      }
    }
  }
}

sink {
  Doris {
    fenodes = "32g006:18030"
    username = "root"
    password = "123456"
    database = "mydb"
    table = "iotdb_result"
    sink.label-prefix = "test_json"
    sink.enable-2pc = "false"
    sink.enable-delete = "true"
    doris.config {
      format = "json"
      read_json_by_line = "true"
    }
    save_mode_create_template = """
      CREATE TABLE IF NOT EXISTS `${database}`.`${table}` (
        `ts` DATETIMEV2 NULL,
        `status` BOOLEAN,
        `hardware` STRING
      ) ENGINE=OLAP
      DUPLICATE KEY(`ts`)
      DISTRIBUTED BY HASH(`ts`) BUCKETS 8
      PROPERTIES (
        "replication_num" = "1"
      )
    """
  }
}

● 点击确定保存

3、保存工作流

● 创建完成

4、上线工作流

● 暂不配置定时任务,手动触发执行

5、运行工作流

6、打开工作流实例

● 查看工作流运行状态

● 执行完成

7、打开任务实例

● 可以看到任务执行完成

七、数据验证

1、同步数据前,查看Doris,没有数据库/表

2、同步数据后,查看Doris,自动创建mydb数据库,iotdb_result表

可快速实现IOTDB数据到Doris的离线同步全流程,打破IOTDB与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。

✅️零代码编排:

拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;

✅️ 稳定可靠:

支持自动重试、告警,避免数据丢失和不一致,适合生产环境;

✅️ 全链路可视化:

任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。

杭州奥零数据科技官网:http://www.aolingdata.com

相关推荐
❀͜͡傀儡师7 小时前
Apache Doris 4.0.0 存算分离手动部署指南
apache·doris 4.0
DolphinScheduler社区3 天前
DolphinScheduler 3.3.2 如何调用 DataX 3.0 + SeaTunnel 2.3.12?附 Demo演示!
java·spark·apache·海豚调度·大数据工作流调度
YaBingSec3 天前
玄机网络安全靶场:Apache HTTPD 解析漏洞(CVE-2017-15715)WP
java·笔记·安全·web安全·php·apache
SuperherRo4 天前
服务攻防-中间件安全&Apache&Tomcat&Jetty&Weblogic&AJP协议&反序列化&CVE漏洞
中间件·tomcat·apache·jetty·weblogic
回忆2012初秋4 天前
时序库.net平台下的推荐 SonnetDB,一文分析清除他与Apache IoTDB的区同
apache·iotdb
逍遥德5 天前
MQTT教程详解-03. 高级知识点
java·物联网·中间件·信息与通信·iot·iotdb
家有娇妻张兔兔5 天前
Apache POI 导出 Word 踩坑实录:Word 分栏为什么做不好左右平铺
c#·word·apache·poi·分栏
HashData酷克数据5 天前
官宣:Apache Cloudberry (Incubating) 2.1.0 正式发布!
apache
weixin_394758036 天前
直播间小程序码生成问题修复代码清单
android·小程序·apache
YaBingSec6 天前
玄机靶场—Apache-druid(CVE-2021-25646) WP
java·开发语言·笔记·安全·php·apache