TDengine 中 TDgp 中添加算法模型(异常检测)

异常检测

输入约定

execute 是算法处理的核心方法。框架调用该方法之前,在对象属性参数 self.list 中已经设置完毕用于异常检测的时间序列数据。

输出约定

execute 方法执行完成后的返回值是长度与 self.list 相同的数组,数组位置 -1 的标识异常值点。

例如:对于输入测量值序列 [ 2 , 2 , 2 , 2 , 100 ] [2, 2, 2, 2, 100] [2,2,2,2,100],假设 100 是异常点,那么方法返回的结果数组则为 [ 1 , 1 , 1 , 1 , − 1 ] [1, 1, 1, 1, -1] [1,1,1,1,−1]。

示例代码

下面我们开发一个示例异常检测算法,在异常检测中,将输入时间序列值的最后一个值设置为异常值,并返回结果。

python 复制代码
from taosanalytics.service import AbstractAnomalyDetectionService

# 算法实现类名称 需要以下划线 "_" 开始,并以 Service 结束
class _MyAnomalyDetectionService(AbstractAnomalyDetectionService):
    """ 定义类,从 AbstractAnomalyDetectionService 继承,并实现 AbstractAnomalyDetectionService 类的抽象方法  """

    # 定义算法调用关键词,全小写 ASCII 码
    name = 'myad'

    # 该算法的描述信息 (建议添加)
    desc = """return the last value as the anomaly data"""

    def __init__(self):
        """类初始化方法"""
        super().__init__()

    def execute(self):
        """ 算法逻辑的核心实现"""

        """创建一个长度为 len(self.list),全部值为 1 的结果数组,然后将最后一个值设置为 -1,表示最后一个值是异常值"""
        res = [1] * len(self.list)
        res[-1] = -1

        """返回结果数组"""
        return res

	
    def set_params(self, params):
        """该算法无需任何输入参数,直接重载父类该函数,不处理算法参数设置逻辑"""
        return super().set_params(params)

将该文件保存在 ./lib/taosanalytics/algo/ad/ 目录下,然后重启 taosanode 服务。在 TDengine CLI 中执行 SHOW ANODES FULL 就能够看到新加入的算法,然后就可以通过 SQL 语句调用该算法。

SQL 复制代码
--- 对 col 列进行异常检测,通过指定 algo 参数为 myad 来调用新添加的异常检测类
SELECT COUNT(*) FROM foo ANOMALY_WINDOW(col, 'algo=myad')

如果是第一次启动该 Anode, 请按照 TDgpt 安装部署 里的步骤先将该 Anode 添加到 TDengine 系统中。

单元测试

在测试目录 taosanalytics/test 中的 anomaly_test.py 中增加单元测试用例或添加新的测试文件。框架中使用了 Python Unit test 包。

python 复制代码
def test_myad(self):
    """ 测试 _IqrService 类 """
    s = loader.get_service("myad")

    # 设置需要进行检测的输入数据
    s.set_input_list(AnomalyDetectionTest.input_list, None)

    r = s.execute()

    # 最后一个点是异常点
    self.assertEqual(r[-1], -1)
    self.assertEqual(len(r), len(AnomalyDetectionTest.input_list))
相关推荐
q***0629几秒前
如何在 Windows 上安装 MySQL(保姆级教程2024版)
数据库·windows·mysql
Blossom.118几秒前
大模型知识蒸馏实战:从Qwen-72B到Qwen-7B的压缩艺术
大数据·人工智能·python·深度学习·算法·机器学习·pygame
JosieBook3 分钟前
【SpringBoot】37 核心功能 - 高级特性- Spring Boot 中的 自定义 Starter 完整教程
java·spring boot·后端
百***06948 分钟前
MySQL 创建新用户及授予权限的完整流程
数据库·mysql
全栈工程师修炼指南22 分钟前
奇技淫巧 | 巧用阿里云免费 ESA:获取用户真实IP地址与地理位置
数据库·阿里云·云计算
小二·22 分钟前
Elasticsearch 面试题精编(26题|含答案|分类整理)
java·大数据·elasticsearch
Apache Flink30 分钟前
打造可编程可集成的实时计算平台:阿里云实时计算 Flink被集成能力深度解析
大数据·阿里云·flink·云计算
BD_Marathon31 分钟前
在 Linux 环境中配置 Eclipse 以开发 Hadoop 应用
java·hadoop·eclipse
CC-NX38 分钟前
大数据安全技术实验:Hadoop环境部署
大数据·hadoop·分布式