时序数据库IoTDB数据导入与查询功能详解

1. 引言

本文将详细介绍 Apache IoTDB 如何实现数据的导入和查询功能,包括自动导入 CSV 格式数据、使用 SQL 语句写入数据以及基本查询和聚合查询等。

2. 数据导入

2.1 IoTDB 架构简介

以实际工业应用场景为例,我们提供了一个测试用的 CSV 格式数据表格,该表格记录了某集团高山风机的轮毂温度数据。

2.2 CSV 导入时间序列和值

Apache IoTDB 提供了 CSV 工具,可以将 CSV 格式的数据导入数据库中。具体步骤如下:

  1. 启动 IoTDB server。
  2. 进入 tools 目录,执行以下命令(以 Linux 和 Mac 系统为例):
bash 复制代码
import-csv.sh -h <ip> -p <port> -u <username> -pw <password> -f <xxx.csv> [-fd <./failedDirectory>]
  • -f 指定要导入的数据文件。
  • -fd 指定保存失败文件的目录(可选)。

2.3 SQL 写入序列和值

除了导入 CSV 数据,还可以使用 SQL 语句创建和写入时间序列数据。

2.3.1 创建单条时间序列
sql 复制代码
create timeseries root.BHSFC.Q1.W003.speed FLOAT encoding=RLE
2.3.2 写入数据
sql 复制代码
insert into root.BHSFC.Q1.W003(timestamp, speed) values(1657468800000, 1)
2.3.3 创建多条时间序列
sql 复制代码
insert into root.ln1.wf01(time, status, temperature) aligned values(1657468800000, 0, 1)

3. 数据基本查询

3.1 使用 select from 语句查询

3.1.1 查询单个时间序列的数据
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002
3.1.2 查询多个时间序列的数据
sql 复制代码
select * from root.BHSFC.** limit 10
3.1.3 查询最新数据
sql 复制代码
select last WROT_HubTmp from root.BHSFC.Q1.W002

3.2 使用 where 语句查询

3.2.1 时间过滤查询
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where time < 2022-01-12
3.2.2 查询时间范围内的最新数据
sql 复制代码
select last WROT_HubTmp from root.BHSFC.Q1.W002 where time >= 2022-1-14T00:00:00
3.2.3 值过滤查询
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where WROT_HubTmp > 20

4. 数据聚合查询

4.1 查询时间序列行数

4.1.1 查询单条时间序列行数
sql 复制代码
select count(WROT_HubTmp) from root.BHSFC.Q1.W002
4.1.2 查询多条时间序列行数
sql 复制代码
select count(*) from root.**

4.2 IoTDB 内置聚合函数功能

4.2.1 单层聚合查询
  • 查询最大值:
sql 复制代码
select MAX_VALUE(*) from root.BHSFC.Q1.W002
  • 查询平均值:
sql 复制代码
select AVG(*) from root.BHSFC.Q1.W002
4.2.2 聚合查询+时间过滤
sql 复制代码
select count(*) from root.BHSFC.Q1.W002 where time > 2022-01-13T00:00:00
4.2.3 分层聚合查询
sql 复制代码
select count(*) from root.** group by level = 2
4.2.4 分段聚合查询
  • 按天分段查询平均值:
sql 复制代码
select AVG(*) from root.BHSFC.Q1.W002 group by ([2022-1-14T00:00:00,2022-1-15T00:00:00),1d)
4.2.5 降采样查询
  • 查询每天的最高风速:
sql 复制代码
select max_value (*) from root.BHSFC.Q1.W002 group by ([2022-1-11T00:00:00,2022-1-15T00:00:00),1d)

4.3 控制填充

4.3.1 前值填充
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where time = 2022-01-16T00:00:00 fill(previous)
4.3.2 线性填充
sql 复制代码
select avg(*) from root.BHSFC.Q1.W002 group by ([2022-1-11T00:00:00,2022-1-15T00:00:00),6h,12h) fill (linear)
4.3.3 特定值填充
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where time = 2022-01-16T00:00:00 fill(15)

5. 结语

通过本文,我们详细了解了 Apache IoTDB 的数据导入和查询功能,包括如何导入 CSV 数据、使用 SQL 语句写入和查询数据,以及如何进行聚合查询和控制空值填充。这些功能为时间序列数据的处理提供了强大的支持。

相关推荐
杰克尼38 分钟前
MYSQL-175. 组合两个表
数据库·mysql
DemonAvenger41 分钟前
MySQL索引原理深度解析与优化策略实战
数据库·mysql·性能优化
189228048611 小时前
NY270NY273美光固态闪存NY277NY287
服务器·网络·数据库·科技·性能优化
Yusei_05231 小时前
迅速掌握Git通用指令
大数据·git·elasticsearch
星霜笔记5 小时前
Docker 部署 MariaDB+phpMyAdmin+Nextcloud 完整教程
运维·数据库·docker·容器·mariadb
一只栖枝7 小时前
华为 HCIE 大数据认证中 Linux 命令行的运用及价值
大数据·linux·运维·华为·华为认证·hcie·it
wyiyiyi10 小时前
【Web后端】Django、flask及其场景——以构建系统原型为例
前端·数据库·后端·python·django·flask
天宇_任11 小时前
Mysql数据库迁移到GaussDB注意事项
数据库·mysql·gaussdb
喂完待续12 小时前
Apache Hudi:数据湖的实时革命
大数据·数据仓库·分布式·架构·apache·数据库架构
青云交12 小时前
Java 大视界 -- 基于 Java 的大数据可视化在城市交通拥堵治理与出行效率提升中的应用(398)
java·大数据·flink·大数据可视化·拥堵预测·城市交通治理·实时热力图