TDengine 中 TDgpt 异常检测的数据密度算法

基于数据密度/数据挖掘的检测算法

LOF[1]: Local Outlier Factor(LOF),局部离群因子/局部异常因子,是 Breunig 在 2000 年提出的一种基于密度的局部离群点检测算法,该方法适用于不同类簇密度分散情况迥异的数据。根据数据点周围的数据密集情况,首先计算每个数据点的局部可达密度,然后通过局部可达密度进一步计算得到每个数据点的一个离群因子。该离群因子即标识了一个数据点的离群程度,因子值越大,表示离群程度越高,因子值越小,表示离群程度越低。最后,输出离群程度最大的 topKtopKtopK 个点。

SQL 复制代码
--- 指定调用的算法为LOF,即可调用该算法
SELECT count(*)
FROM foo
ANOMALY_WINDOW(foo.i32, "algo=lof")

后续待添加基于数据挖掘检测算法

  • DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
  • K-Nearest Neighbors (KNN)
  • Principal Component Analysis (PCA)

第三方异常检测算法库

  • PyOD

参考文献

  1. Breunig, M. M.; Kriegel, H.-P.; Ng, R. T.; Sander, J. (2000). LOF: Identifying Density-based Local Outliers (PDF). Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. SIGMOD. pp. 93--104. doi:10.1145/335191.335388. ISBN 1-58113-217-4.
相关推荐
智海观潮2 分钟前
Flink在与AI集成的路上再次“遥遥领先” - Flink Agents
大数据·人工智能·flink
一念&2 小时前
每日一个C语言知识:C 头文件
c语言·开发语言·算法
北邮-吴怀玉4 小时前
1.4.1 大数据方法论与实践指南-元数据治理
大数据
程序员小凯5 小时前
Spring Boot文件处理与存储详解
java·spring boot·后端
Miraitowa_cheems6 小时前
LeetCode算法日记 - Day 88: 环绕字符串中唯一的子字符串
java·数据结构·算法·leetcode·深度优先·动态规划
黑云压城After6 小时前
vue2实现图片自定义裁剪功能(uniapp)
java·前端·javascript
11年老程序猿在线搬砖6 小时前
如何搭建自己的量化交易平台
大数据·人工智能·python·自动交易·量化交易系统
Elastic 中国社区官方博客6 小时前
Elasticsearch 开放推理 API 增加了对 Google 的 Gemini 模型的支持
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·googlecloud
周杰伦_Jay6 小时前
【实战|旅游知识问答RAG系统全链路解析】从配置到落地(附真实日志数据)
大数据·人工智能·分布式·机器学习·架构·旅游·1024程序员节
B站_计算机毕业设计之家6 小时前
python电商商品评论数据分析可视化系统 爬虫 数据采集 Flask框架 NLP情感分析 LDA主题分析 Bayes评论分类(源码) ✅
大数据·hadoop·爬虫·python·算法·数据分析·1024程序员节