时序数据库IoTDB数据导入与查询功能详解

1. 引言

本文将详细介绍 Apache IoTDB 如何实现数据的导入和查询功能,包括自动导入 CSV 格式数据、使用 SQL 语句写入数据以及基本查询和聚合查询等。

2. 数据导入

2.1 IoTDB 架构简介

以实际工业应用场景为例,我们提供了一个测试用的 CSV 格式数据表格,该表格记录了某集团高山风机的轮毂温度数据。

2.2 CSV 导入时间序列和值

Apache IoTDB 提供了 CSV 工具,可以将 CSV 格式的数据导入数据库中。具体步骤如下:

  1. 启动 IoTDB server。
  2. 进入 tools 目录,执行以下命令(以 Linux 和 Mac 系统为例):
bash 复制代码
import-csv.sh -h <ip> -p <port> -u <username> -pw <password> -f <xxx.csv> [-fd <./failedDirectory>]
  • -f 指定要导入的数据文件。
  • -fd 指定保存失败文件的目录(可选)。

2.3 SQL 写入序列和值

除了导入 CSV 数据,还可以使用 SQL 语句创建和写入时间序列数据。

2.3.1 创建单条时间序列
sql 复制代码
create timeseries root.BHSFC.Q1.W003.speed FLOAT encoding=RLE
2.3.2 写入数据
sql 复制代码
insert into root.BHSFC.Q1.W003(timestamp, speed) values(1657468800000, 1)
2.3.3 创建多条时间序列
sql 复制代码
insert into root.ln1.wf01(time, status, temperature) aligned values(1657468800000, 0, 1)

3. 数据基本查询

3.1 使用 select from 语句查询

3.1.1 查询单个时间序列的数据
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002
3.1.2 查询多个时间序列的数据
sql 复制代码
select * from root.BHSFC.** limit 10
3.1.3 查询最新数据
sql 复制代码
select last WROT_HubTmp from root.BHSFC.Q1.W002

3.2 使用 where 语句查询

3.2.1 时间过滤查询
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where time < 2022-01-12
3.2.2 查询时间范围内的最新数据
sql 复制代码
select last WROT_HubTmp from root.BHSFC.Q1.W002 where time >= 2022-1-14T00:00:00
3.2.3 值过滤查询
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where WROT_HubTmp > 20

4. 数据聚合查询

4.1 查询时间序列行数

4.1.1 查询单条时间序列行数
sql 复制代码
select count(WROT_HubTmp) from root.BHSFC.Q1.W002
4.1.2 查询多条时间序列行数
sql 复制代码
select count(*) from root.**

4.2 IoTDB 内置聚合函数功能

4.2.1 单层聚合查询
  • 查询最大值:
sql 复制代码
select MAX_VALUE(*) from root.BHSFC.Q1.W002
  • 查询平均值:
sql 复制代码
select AVG(*) from root.BHSFC.Q1.W002
4.2.2 聚合查询+时间过滤
sql 复制代码
select count(*) from root.BHSFC.Q1.W002 where time > 2022-01-13T00:00:00
4.2.3 分层聚合查询
sql 复制代码
select count(*) from root.** group by level = 2
4.2.4 分段聚合查询
  • 按天分段查询平均值:
sql 复制代码
select AVG(*) from root.BHSFC.Q1.W002 group by ([2022-1-14T00:00:00,2022-1-15T00:00:00),1d)
4.2.5 降采样查询
  • 查询每天的最高风速:
sql 复制代码
select max_value (*) from root.BHSFC.Q1.W002 group by ([2022-1-11T00:00:00,2022-1-15T00:00:00),1d)

4.3 控制填充

4.3.1 前值填充
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where time = 2022-01-16T00:00:00 fill(previous)
4.3.2 线性填充
sql 复制代码
select avg(*) from root.BHSFC.Q1.W002 group by ([2022-1-11T00:00:00,2022-1-15T00:00:00),6h,12h) fill (linear)
4.3.3 特定值填充
sql 复制代码
select WROT_HubTmp from root.BHSFC.Q1.W002 where time = 2022-01-16T00:00:00 fill(15)

5. 结语

通过本文,我们详细了解了 Apache IoTDB 的数据导入和查询功能,包括如何导入 CSV 数据、使用 SQL 语句写入和查询数据,以及如何进行聚合查询和控制空值填充。这些功能为时间序列数据的处理提供了强大的支持。

相关推荐
字节跳动数据平台9 分钟前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
全栈老石18 分钟前
拆解低代码引擎核心:元数据驱动的"万能表"架构
数据库·低代码
得物技术1 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
冬奇Lab2 小时前
一天一个开源项目(第39篇):PandaWiki - AI 驱动的开源知识库搭建系统
人工智能·开源·资讯
武子康3 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
HelloGitHub4 小时前
这个年轻的开源项目,想让每个人都能拥有自己的专业级 AI 智能体
开源·github·agent
Kagol15 小时前
🎉OpenTiny NEXT-SDK 重磅发布:四步把你的前端应用变成智能应用!
前端·开源·agent
冬奇Lab16 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab16 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
sunny86517 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github