高效同步!离线开发平台(DolphinScheduler) 实现Apache IotDB物联网数据同步到 Doris

【AllData数据中台】集成开源项目 DolphinScheduler,构建了可视化、高可靠的离线开发平台。

本文将完整演示Apache IOTDB数据同步到 Doris的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。

共包含以下国内外开源组件:
1、开源项目

1.1 apache iotdb开源项目

1.2 apache dolphinscheduler开源项目

1.3 apache seatunnel开源项目

1.4 alldatacenter alldata开源项目

2、开源项目地址

2.1 https://github.com/apache/iotdb

2.2 https://github.com/apache/dolphinscheduler

2.3 https://github.com/apache/seatunnel

2.4 https://github.com/alldatacenter/alldata

一、环境准备

● iotdb 版本:1.3.0

● Doris 版本:doris-2.0.7

● SeaTunnel 版本:2.3.13

二、进入数据源管理平台

1、iotdb数据信息

2、创建Doris库表(无需操作,自动建表)

● 此时还未同步数据,doris中无相关表结构

三、进入离线开发平台

四、配置环境

1、打开安全中心

2、在左侧菜单选择环境管理

3、创建环境

● 配置 JDK

● 配置 SeatunnelServer

● 确定

五、创建任务

1、打开项目管理

2、创建项目

六、点击项目名称


1、打开工作流定义

2、创建工作流

● 找到数据集成 SEATUNNEL,拖拽到画板


● 填写必填项

● 页面下滑,找到脚本设置

● 加入以下脚本内容

java 复制代码
env {
  parallelism = 2
  job.mode = "BATCH"
}

source {
  IoTDB {
    node_urls = "32g006:26667"
    username = "root"
    password = "root"
    sql = "select status, hardware from root.ln.wf02.wt02"
    schema {
      fields {
        ts = timestamp
        status = boolean
        hardware = string
      }
    }
  }
}

sink {
  Doris {
    fenodes = "32g006:18030"
    username = "root"
    password = "123456"
    database = "mydb"
    table = "iotdb_result"
    sink.label-prefix = "test_json"
    sink.enable-2pc = "false"
    sink.enable-delete = "true"
    doris.config {
      format = "json"
      read_json_by_line = "true"
    }
    save_mode_create_template = """
      CREATE TABLE IF NOT EXISTS `${database}`.`${table}` (
        `ts` DATETIMEV2 NULL,
        `status` BOOLEAN,
        `hardware` STRING
      ) ENGINE=OLAP
      DUPLICATE KEY(`ts`)
      DISTRIBUTED BY HASH(`ts`) BUCKETS 8
      PROPERTIES (
        "replication_num" = "1"
      )
    """
  }
}

● 点击确定保存

3、保存工作流

● 创建完成

4、上线工作流

● 暂不配置定时任务,手动触发执行

5、运行工作流

6、打开工作流实例

● 查看工作流运行状态

● 执行完成

7、打开任务实例

● 可以看到任务执行完成

七、数据验证

1、同步数据前,查看Doris,没有数据库/表

2、同步数据后,查看Doris,自动创建mydb数据库,iotdb_result表

可快速实现IOTDB数据到Doris的离线同步全流程,打破IOTDB与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。

✅️零代码编排:

拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;

✅️ 稳定可靠:

支持自动重试、告警,避免数据丢失和不一致,适合生产环境;

✅️ 全链路可视化:

任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。

杭州奥零数据科技官网:http://www.aolingdata.com

相关推荐
程序 代码狂人2 小时前
Apache是什么
apache
颜颜yan_2 小时前
面向工业物联网的大数据底座选型:Apache IoTDB 的架构能力与落地价值分析
大数据·物联网·apache
Eason_LYC2 小时前
封神!Apache OFBiz CVE-2024-45507 漏洞复现(从入门到反弹Shell,新手也能拿捏服务器)
服务器·web安全·网络安全·apache·apache ofbiz·cve-2024-45507·getshell
脑电信号要分类21 小时前
将多张图片拼接成一个pdf文件输出
pdf·c#·apache
不是书本的小明1 天前
Apache vs Nginx vs Tomcat 核心区别与优化
nginx·tomcat·apache
Suchadar3 天前
源码编译Apache
apache
一字白首3 天前
小程序组件化进阶:从复用到通信的完整指南DAY04
前端·小程序·apache
专注_每天进步一点点4 天前
mysql-connector-j(8.0 及以上版本,包括你使用的 8.3.0)并非采用 GPL 许可证,因此你在项目中引入该依赖时,不需要遵循 GPL 的开源要求(比如开源你的整个项目)
数据库·mysql·apache
不爱学英文的码字机器4 天前
Apache RocketMQ+cpolar 让消息服务全网可达
apache·rocketmq