【机器学习300问】40、如何评估一个异常检测系统?

上一篇文章是我学习异常检测系统如何实现的学习笔记,这篇文章接着上文记录几个评价异常检测系统的关键步骤和指标。如果友友们没有看过之前的文章可以点击下面的链接去看看哦!

【机器学习300问】39、高斯分布模型如何实现异常检测?http://t.csdnimg.cn/sPwBP

〇、假设异常检测的任务要求

假设我们负责管理电机设备网络共有10000台电机是正常的,各项监测指标(如温度、转速、电流、电压等)均在正常范围内波动。有20台电机是异常的,这些异常包括但不限于电机温度突然飙升、电流波动异常增大、转速不稳定等情况。

现在我们的目标就是通过有效的数据分析和机器学习算法,利用那9980台正常电机的数据来构建模型,识别出电机的正常行为模式。然后,我们将模型应用到整个电机网络中,以此来检测那20台异常电机以及其他未来可能出现类似异常的电机。

一、具体评价步骤

(1)根据正常数据和异常数据来分配数据集

  • 训练集 :6000台正常电机的数据作为训练集,用来训练模型学习正常数据的分布特征,估计特征的平均值和方差构建异常检测模型
  • 交叉验证集:可以将一部分已知正常数据与少量已知异常数据混合,例如2000台正常电机和10台异常电机的数据作为交叉检验集,用来调整阈值和优化模型参数,确保模型在含有异常情况下的表现。
  • 测试集:剩余的正常数据和尽可能多的真实异常数据构成测试集,例如2000台正常电机和10台异常电机的数据作为测试集,用于评估模型的最终性能。

(2)构建异常检测模型

首先利用6000台正常电机的数据构建训练集,通过分析这些数据来了解正常电机运行时的各项指标(如温度、振动、电流等)的分布特征,基于这些数据估计出特征的平均值和方差,以此为基础建立异常检测模型,该模型能够识别出与正常状态不符的电机行为。

接下来,在模型训练完成后,为了确保模型在面对既有正常又有异常情况时依然能准确识别异常,我们采用了一个混合数据集作为交叉检验集。这个交叉检验集包含了2000台正常电机的数据和仅有的10台异常电机的数据。通过在该集合上调整模型阈值和优化参数,可以评估模型在包含异常样本条件下的性能,确保模型既不过于敏感导致误报过多,也不过于迟钝导致遗漏真正的异常。

(3)选择合适的评估指标进行评估

最后,为了全面且客观地评价模型在真实环境下的性能,保留了一部分正常电机数据(2000台)以及尽可能多的真实异常电机数据(同样假设为10台),组成测试集。通过测试集上的表现,我们可以得到模型在未知数据上的精确度、召回率以及F1分数等评估指标,从而对模型进行全面验收和最终性能评估。

二、 如何确定正常与异常的阈值?

即使在无标签数据集上,通过调整阈值并观察模型性能指标的变化来确定阈值,指标可以是精确率、召回率或F1分数,之前我在:

【机器学习300问】31、不平衡数据集如何进行机器学习?http://t.csdnimg.cn/Aciz8 中介绍过,面对这种不平衡数据集(异常检测就是很典型的不平衡数据集任务)可以精确率、召回率或F1分数来衡量机器学习模型的性能。通过评价模型在某个阈值下的误识别(误报)和漏识别(漏报)情况来调整阈值。

例如:画出F1分数与阈值的函数曲线图,通过曲线的最高点来确定最佳阈值。

相关推荐
code_pgf3 分钟前
mllm训练过程中有效地利用辅助监督信号来减少幻觉的方法
人工智能·深度学习·计算机视觉
风华圆舞5 分钟前
鸿蒙 + Flutter 下 AI 助手为什么要支持流式输出
人工智能·flutter·harmonyos
爱勇宝5 分钟前
如何评价 Claude Fable 5 全球暂停访问?
人工智能·程序员
装不满的克莱因瓶6 分钟前
自然语言处理常见任务——从文本理解到生成式AI的完整任务体系
人工智能·pytorch·python·深度学习·ai·自然语言处理
朱大喜8 分钟前
AI 数据分析实战:大模型驱动的自动化报表生成,从数据到洞察的工程化链路
人工智能
wb0430720120 分钟前
阿明的二次创业——从阿明用 AI 开第二家店,看 AI 原生创业的四阶段方法论
大数据·人工智能·架构
Godspeed Zhao20 分钟前
Level 4自动驾驶系统设计0——功能与场景0
人工智能·机器学习·自动驾驶
Dola_Zou23 分钟前
边缘智能的“黑暗森林”:工业 AI 模型下沉的资产防护与变现密码
人工智能·安全·自动化·软件工程·软件加密
青岛前景互联信息技术有限公司24 分钟前
前景互联·新一代智能接处警系统:AI+大模型+Agent智能接处警一体化解决方案
大数据·人工智能·物联网
xin_yao_xin26 分钟前
Claude Code 安装与 DeepSeek-V4 模型配置(2026 最新)
人工智能·ai·大模型·deepseek·claude code