TDengine 聚合函数 VAR_POP 用户手册

VAR_POP 函数用户手册

1. 函数概述

VAR_POP 是 TDengine 的聚合函数,用于计算总体方差(Population Variance),即衡量一组数据的离散程度。总体方差假定所有数据是总体数据而非样本数据。

2. 语法

sql 复制代码
SELECT VAR_POP(column_name) FROM meters [WHERE condition];
-- 或用于窗口聚合
SELECT VAR_POP(column_name) FROM meters [WHERE condition] INTERVAL(window_size);
  • column_name:需要计算方差的字段,必须为数值类型(如 FLOAT、DOUBLE、INT 等)。
  • meters:智能电表超级表名。
  • condition:可选,筛选数据的条件。
  • window_size:如 1h1d,窗口聚合单位。

3. 计算原理

总体方差公式:

复制代码
σ² = Σ(xi - μ)² / N
  • σ²:总体方差
  • xi:第 i 个数据值
  • μ:总体均值
  • N:数据总数

4. 为什么要用 VAR_POP?

  • 数据波动性分析:方差越大,数据波动越明显。可用于监控电流、电压、功率等参数的稳定性。
  • 异常检测:方差异常增大,可能说明设备故障或用电异常。
  • 质量评估:评估电网或设备运行的稳定性。
  • 趋势分析:对比不同区域或设备的方差,发现用电模式变化。

5. 智能电表表结构举例

sql 复制代码
CREATE TABLE meters (
    ts TIMESTAMP,
    voltage FLOAT,
    current FLOAT,
    power FLOAT
) TAGS (
    groupid INT,
    location VARCHAR(50)
);

6. 使用场景举例

6.1 电压总体方差分析

sql 复制代码
SELECT VAR_POP(voltage) AS voltage_var_pop FROM meters WHERE ts >= NOW() - 1d;

说明:统计过去一天所有电表电压的总体方差,分析电网稳定性。


6.2 按区域分组分析电流方差

sql 复制代码
SELECT location, VAR_POP(current) AS current_var_pop FROM meters WHERE ts >= NOW() - 7d GROUP BY location;

说明:对比不同区域的电流波动情况。


6.3 按设备组分析功率方差

sql 复制代码
SELECT groupid, VAR_POP(power) AS power_var_pop FROM meters WHERE ts >= NOW() - 30d GROUP BY groupid;

说明:分析不同设备组的功率波动,辅助设备健康管理。


6.4 时间窗口分析

sql 复制代码
-- 每小时电压方差
SELECT VAR_POP(voltage) AS hourly_voltage_var FROM meters WHERE ts >= NOW() - 1d INTERVAL(1h);

-- 每日功率方差
SELECT VAR_POP(power) AS daily_power_var FROM meters WHERE ts >= NOW() - 30d INTERVAL(1d);

说明:监控电力参数在不同时间窗口内的波动性。


6.5 异常检测(嵌套查询)

sql 复制代码
SELECT groupid, location, voltage_var, current_var, sample_count
FROM (
    SELECT groupid, location, VAR_POP(voltage) AS voltage_var, VAR_POP(current) AS current_var, COUNT(*) AS sample_count
    FROM meters
    WHERE ts >= NOW() - 1h
    GROUP BY groupid, location
)
WHERE voltage_var > 9.0 OR current_var > 2.0;

说明:筛选出方差异常的设备组和区域,便于运维人员及时处理。


7. VAR_POP 与 STDDEV、STDDEV_POP 的区别

函数 计算内容 公式分母 结果类型 适用场景
VAR_POP 总体方差 N DOUBLE 总体波动分析
STDDEV_POP 总体标准差 N DOUBLE 总体波动分析
STDDEV 样本标准差 N-1 DOUBLE 样本推断、统计分析
  • VAR_POP 返回的是方差(波动的平方),STDDEV_POP 返回的是标准差(波动的实际值)。
  • 方差适合做数学建模、风险评估、异常检测等场景;标准差更适合直接反映数据的实际波动幅度。
  • STDDEV 用于样本数据推断总体特征,适合统计推断和假设检验。

8. 注意事项

  • 仅支持数值型字段。
  • NULL 值自动忽略。
  • 支持窗口聚合和分组聚合。
  • 不支持在 WHERE 子句中直接调用聚合函数,若需复杂筛选请使用嵌套查询。
  • 方差单位为原数据单位的平方。

通过合理使用 VAR_POP 函数,用户可以高效分析智能电表数据的波动性,辅助异常检测、设备健康管理和电网质量监控。

相关文章

  1. TDengine 聚合函数 STDDEV 用户手册
  2. TDengine 聚合函数 STDDEV_POP 用户手册

关于 TDengine

TDengine 专为物联网IoT平台、工业大数据平台设计。其中,TDengine TSDB 是一款高性能、分布式的时序数据库(Time Series Database),同时它还带有内建的缓存、流式计算、数据订阅等系统功能;TDengine IDMP 是一款AI原生工业数据管理平台,它通过树状层次结构建立数据目录,对数据进行标准化、情景化,并通过 AI 提供实时分析、可视化、事件管理与报警等功能。

相关推荐
Dobby_053 小时前
【Hadoop】HBase:构建于HDFS之上的分布式列式NoSQL数据库
大数据·hadoop·分布式·hbase
糖糖单片机设计3 小时前
硬件开发_基于STM32单片机的汽车急控系统
stm32·单片机·嵌入式硬件·物联网·汽车·51单片机
ApacheSeaTunnel3 小时前
(三)数仓人必看!ODS 到 DWS 各层设计规范全解析,含同步/存储/质量核心要点
大数据·数仓·数据集成·技术分享
不剪发的Tony老师3 小时前
SQLite Expert:一款功能强大的SQLite管理工具
数据库·sqlite
麦当_4 小时前
Cloudflare Workers 环境下的数据库死锁问题及解决方案
javascript·数据库·后端
酸奶不吃鱼。4 小时前
Flume1.9 采集数据到 Hive3.1.2 实战:配置详解与 NoClassDefFoundError 报错解决
大数据·数据库开发
大数据CLUB4 小时前
基于hive和mapreduce的地铁数据分析及可视化
大数据·hive·hadoop·分布式·数据分析·mapreduce
xhbh6664 小时前
【硬核对比】Hive与MySQL全方位深度对比:从架构、SQL语法到应用场景,搞懂选型不踩坑
数据库·mysql·hive和mysql的区别
想去的远方4 小时前
hive调优系列-3.HQL语法和运行参数层面
大数据·数据仓库·hive·hadoop