TDengine 聚合函数 VAR_POP 用户手册

VAR_POP 函数用户手册

1. 函数概述

VAR_POP 是 TDengine 的聚合函数,用于计算总体方差(Population Variance),即衡量一组数据的离散程度。总体方差假定所有数据是总体数据而非样本数据。

2. 语法

sql 复制代码
SELECT VAR_POP(column_name) FROM meters [WHERE condition];
-- 或用于窗口聚合
SELECT VAR_POP(column_name) FROM meters [WHERE condition] INTERVAL(window_size);
  • column_name:需要计算方差的字段,必须为数值类型(如 FLOAT、DOUBLE、INT 等)。
  • meters:智能电表超级表名。
  • condition:可选,筛选数据的条件。
  • window_size:如 1h1d,窗口聚合单位。

3. 计算原理

总体方差公式:

复制代码
σ² = Σ(xi - μ)² / N
  • σ²:总体方差
  • xi:第 i 个数据值
  • μ:总体均值
  • N:数据总数

4. 为什么要用 VAR_POP?

  • 数据波动性分析:方差越大,数据波动越明显。可用于监控电流、电压、功率等参数的稳定性。
  • 异常检测:方差异常增大,可能说明设备故障或用电异常。
  • 质量评估:评估电网或设备运行的稳定性。
  • 趋势分析:对比不同区域或设备的方差,发现用电模式变化。

5. 智能电表表结构举例

sql 复制代码
CREATE TABLE meters (
    ts TIMESTAMP,
    voltage FLOAT,
    current FLOAT,
    power FLOAT
) TAGS (
    groupid INT,
    location VARCHAR(50)
);

6. 使用场景举例

6.1 电压总体方差分析

sql 复制代码
SELECT VAR_POP(voltage) AS voltage_var_pop FROM meters WHERE ts >= NOW() - 1d;

说明:统计过去一天所有电表电压的总体方差,分析电网稳定性。


6.2 按区域分组分析电流方差

sql 复制代码
SELECT location, VAR_POP(current) AS current_var_pop FROM meters WHERE ts >= NOW() - 7d GROUP BY location;

说明:对比不同区域的电流波动情况。


6.3 按设备组分析功率方差

sql 复制代码
SELECT groupid, VAR_POP(power) AS power_var_pop FROM meters WHERE ts >= NOW() - 30d GROUP BY groupid;

说明:分析不同设备组的功率波动,辅助设备健康管理。


6.4 时间窗口分析

sql 复制代码
-- 每小时电压方差
SELECT VAR_POP(voltage) AS hourly_voltage_var FROM meters WHERE ts >= NOW() - 1d INTERVAL(1h);

-- 每日功率方差
SELECT VAR_POP(power) AS daily_power_var FROM meters WHERE ts >= NOW() - 30d INTERVAL(1d);

说明:监控电力参数在不同时间窗口内的波动性。


6.5 异常检测(嵌套查询)

sql 复制代码
SELECT groupid, location, voltage_var, current_var, sample_count
FROM (
    SELECT groupid, location, VAR_POP(voltage) AS voltage_var, VAR_POP(current) AS current_var, COUNT(*) AS sample_count
    FROM meters
    WHERE ts >= NOW() - 1h
    GROUP BY groupid, location
)
WHERE voltage_var > 9.0 OR current_var > 2.0;

说明:筛选出方差异常的设备组和区域,便于运维人员及时处理。


7. VAR_POP 与 STDDEV、STDDEV_POP 的区别

函数 计算内容 公式分母 结果类型 适用场景
VAR_POP 总体方差 N DOUBLE 总体波动分析
STDDEV_POP 总体标准差 N DOUBLE 总体波动分析
STDDEV 样本标准差 N-1 DOUBLE 样本推断、统计分析
  • VAR_POP 返回的是方差(波动的平方),STDDEV_POP 返回的是标准差(波动的实际值)。
  • 方差适合做数学建模、风险评估、异常检测等场景;标准差更适合直接反映数据的实际波动幅度。
  • STDDEV 用于样本数据推断总体特征,适合统计推断和假设检验。

8. 注意事项

  • 仅支持数值型字段。
  • NULL 值自动忽略。
  • 支持窗口聚合和分组聚合。
  • 不支持在 WHERE 子句中直接调用聚合函数,若需复杂筛选请使用嵌套查询。
  • 方差单位为原数据单位的平方。

通过合理使用 VAR_POP 函数,用户可以高效分析智能电表数据的波动性,辅助异常检测、设备健康管理和电网质量监控。

相关文章

  1. TDengine 聚合函数 STDDEV 用户手册
  2. TDengine 聚合函数 STDDEV_POP 用户手册

关于 TDengine

TDengine 专为物联网IoT平台、工业大数据平台设计。其中,TDengine TSDB 是一款高性能、分布式的时序数据库(Time Series Database),同时它还带有内建的缓存、流式计算、数据订阅等系统功能;TDengine IDMP 是一款AI原生工业数据管理平台,它通过树状层次结构建立数据目录,对数据进行标准化、情景化,并通过 AI 提供实时分析、可视化、事件管理与报警等功能。

相关推荐
zhangkaixuan45616 小时前
Apache Paimon 写入流程
java·大数据·apache·paimon
Java爱好狂.16 小时前
分布式ID|从源码角度深度解析美团Leaf双Buffer优化方案
java·数据库·分布式·分布式id·es·java面试·java程序员
Elastic 中国社区官方博客16 小时前
通过混合搜索重排序提升多语言嵌入模型的相关性
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
倔强的石头10617 小时前
KingbaseES:从兼容到超越,详解超越MySQL的权限隔离与安全增强
数据库·mysql·安全·金仓数据库
J-JunLiang17 小时前
Flink 实时开发:关键知识点
大数据·flink
小鸡毛程序员17 小时前
我在CSDN学MYSQL之----数据库基本概念和基本知识(下)
数据库·mysql
极造数字17 小时前
从EMS看分布式能源发展:挑战与机遇并存
人工智能·分布式·物联网·信息可视化·能源·制造
liliangcsdn18 小时前
如何使用elasticdump进行elasticsearch数据还原
大数据·elasticsearch·搜索引擎
程序定小飞18 小时前
基于springboot的web的音乐网站开发与设计
java·前端·数据库·vue.js·spring boot·后端·spring
小灰灰搞电子18 小时前
Rust 操作Sqlite数据库详细教程
数据库·rust·sqlite