时序数据库

sql 复制代码
SELECT *,max(lp_index)   FROM lp.tdm_lp_original_data 
where ts >= '2023-12-28 18:11:33.521'
and ts <= '2023-12-29 19:03:12.148' 
INTERVAL(2s)
FILL(PREV)

在时间序列数据库TDengine中,FILL函数与GROUP BY子句结合使用,提供了对于在指定间隔内可能存在的数据空缺的填充策略。FILL(PREV)FILL(linear)FILL函数的不同选项,它们填充数据缺失值的方式有所区别:

  1. FILL(PREV):当数据序列中存在时间间隔内没有数据的情况时,FILL(PREV)会将缺失的数据点填充为前一个时间间隔的值。换句话说,它会复制上一个已知数据点的值来填充当前缺失的时间间隔。

    例如,如果您有以下数据序列:

XML 复制代码
12:00 - 100
12:10 - 缺失
12:20 - 110

使用FILL(PREV)进行填充后,12:10的值将会被设定为前一时间点12:00的值,即100。

  1. FILL(linear):与FILL(PREV)不同的是,FILL(linear)会对缺失的数据点使用线性插值填充。它假设相邻的数据点之间的值变化是线性的,并且基于此来计算缺失点的值。

    比如,同样的数据序列:

XML 复制代码
12:00 - 100
12:10 - 缺失
12:20 - 110

使用FILL(linear)进行填充后,12:10的值将会被设定为一个线性插入值,这个值将会介于12:00和12:20的值之间。在这个例子中,由于12:20的值增加了10(从100到了110),那么线性插值的结果将会是105。

选择使用哪种方式取决于数据的性质和特点,以及您希望如何处理数据缺失的策略。FILL(PREV)能够保持数据的平滑性,而FILL(linear)则更适合处理数据变化趋势较为连续的场景。

在某些时间序列数据库中,如果遇到没有数据的情况,你可能希望使用附近时间点的数据来填充这些缺失的数据点。在TDengine这样的时间序列数据库中,提供了几种选项来处理这类情况,但功能的支持和具体实现可能会根据数据库版本和配置而有所不同。

以下是常见的几种方法来处理这种情况:

  1. FILL(PREV):如前所述,这个选项会用前一个非空的数据点来填充当前的空值。

  2. FILL(NEXT):与FILL(PREV)相对,这个选项会用后一个非空的数据点来填充当前的空值。

  3. FILL(linear):对于缺失的时间点,采用线性插值的方法基于周围已知的数据点估算出缺失值。

  4. FILL(NONE):不填充,即使有数据缺失,也不进行处理,这将会保留数据的空缺状态。

  5. 使用子查询或者窗口函数:在不支持直接从附近时间点取数据的数据库中,可能需要使用更为复杂的SQL查询来实现。例如,可以用子查询来寻找每个缺失数据点的前一个和后一个数据点,并通过外部查询逻辑来决定如何填充。

例如,在 PostgreSQL 的 TimescaleDB扩展或者 MySQL 中,你可以使用窗口函数 LEAD()LAG() 来访问时间序列中当前行之前或之后的行。结合条件逻辑,这样可以在没有直接支持的情况下实现类似 FILL(PREV)FILL(NEXT) 的功能。

在使用任何填充策略之前,请检查你所使用的数据库系统文档来确认支持的方法和正确的语法。如果你不确定如何操作,或者在尝试标准方法时遇到问题,可能需要考虑自定义SQL查询或使用数据库提供的程序功能来实现需求。

时间窗口

时间窗口又可分为滑动时间窗口和翻转时间窗口。

INTERVAL 子句用于产生相等时间周期的窗口,SLIDING 用以指定窗口向前滑动的时间。每次执行的查询是一个时间窗口,时间窗口随着时间流动向前滑动。在定义连续查询的时候需要指定时间窗口(time window )大小和每次前向增量时间(forward sliding times)。如图,t0s, t0et1s , t1et2s, t2e 是分别是执行三次连续查询的时间窗口范围,窗口的前向滑动的时间范围 sliding time 标识 。查询过滤、聚合等操作按照每个时间窗口为独立的单位执行。当 SLIDING 与 INTERVAL 相等的时候,滑动窗口即为翻转窗口。

XML 复制代码
SELECT *,max(lp_index)   FROM lp.tdm_lp_original_data 
where lp_time_ticks >= '2023-06-03 18:11:33.521'
and lp_time_ticks <= '2023-12-29 19:03:12.148' 
INTERVAL(20m)  SLIDING(2m)
相关推荐
ZC跨境爬虫15 分钟前
跟着 MDN 学CSS day_41:显式轨道、隐式网格与区域命名放置
前端·javascript·css·ui·交互
weelinking25 分钟前
【产品】12_接入数据库——让数据永久保存
jvm·数据库·python·react.js·数据挖掘·前端框架·产品经理
稳联技术老娜28 分钟前
DeviceNet主站怎么连接西门子PLC,Profinet网关配置手册(那智机器人)
服务器·网络·数据库
这个DBA有点耶1 小时前
云上运维新挑战:当数据库不再“看得见摸得着”
数据库·sql·程序人生·云原生·运维开发·学习方法·dba
修己xj1 小时前
告别手动存图!这款叫 Fatkun 的浏览器插件,简直是素材收集神器
前端
袋鼠云数栈2 小时前
从前端到基础设施,ACOS 如何打通企业全链路可观测
运维·前端·人工智能·数据治理·数据智能
AskHarries2 小时前
系统提示词、开发者指令和用户输入的优先级
java·前端·数据库
Moment2 小时前
长上下文会最终杀死 Rag 吗?
前端·javascript·后端
消失在人海中2 小时前
oracle 数据库多表关联查询
服务器·数据库·oracle
九皇叔叔2 小时前
PostgreSQL/openGauss pg_stats 视图从入门到精通:统计信息、执行计划与慢 SQL 优化实战
数据库·sql·postgresql