原来工业 AI 异常检测只做了一半?AnomalyNCD 补上了“最关键一环”

【导读】

在工业质检中,发现异常并不难,但"认识"异常却很难。现有检测方法大多只能告诉你"这有问题",却无法说明"出了什么问题",更别提识别此前未曾见过的"新型缺陷"。

为了解决这一痛点,华中科技大学等研究团队在CV领域最新论文中提出了AnomalyNCD,一个支持工业场景中异常分类与新类别发现的通用框架,兼容主流检测器,在MVTec AD和MTD两大数据集上全面领先。

过去已经有很多优秀的异常检测方法,能准确圈出"哪里不对劲",但在实际工业应用中,这远远不够。如果不能进一步判断缺陷类型、归因问题根源、甚至识别此前从未见过的新型异常,就无法真正做到智能化的质检分析。而这正是当前大多数方法的"短板"。

AnomalyNCD的出现,就是为了解决这一从"检测"到"理解"的跨越。它不仅能识别异常,更能学习如何分类这些异常,甚至面对从未见过的缺陷类型,也能"自学成才"完成归类,真正赋予系统"类比与认知"能力。

项目开源地址:

github.com/HUST-SLOW/A...

为什么"发现异常"远远不够?

近年来,工业异常检测方法已能有效定位图像中的缺陷区域,但对于下游流程而言,仅仅检测"有问题"还远远不够。

例如,在实际生产中,我们不仅需要知道某个零件是否异常,还需要明确是哪一类问题------是裂纹、烧蚀还是磨损?更进一步,很多缺陷在初期甚至没有明确的定义,因此模型需要具备"发现未知异常类型"的能力,即异常多分类与新类别发现(Novel Class Discovery, NCD)。

但这并不容易。工业异常的"语义性"很弱,往往形态不显著、位于图像角落,现有方法在这种低语义场景中容易混淆背景与前景。

技术创新:三大模块构建强健异常识别框架


AnomalyNCD 结合异常检测与新类别发现(Novel Class Discovery, NCD)思想,构建了一个完整的异常多分类管线。核心包括三个创新设计:

  • 主元素二值化 MEBin:从异常图中提纯"可信区域"

工业检测容易产生伪异常(误检)和漏检。为了避免这些噪声影响学习,AnomalyNCD 首先设计了主元素二值化算法(MEBin),从检测器输出的异常热图中提取稳定出现的异常区域。

  • 通过多阈值滑动,统计区域数量变化,选择最稳定的一段,作为主要异常区域。
  • 显著减少误分割,提高后续学习质量。
  • 掩码引导的表示学习:让ViT"看对地方"

ViT虽强,但在工业场景容易"注意力跑偏"。作者提出掩码引导注意力机制,只引导 [CLS] token 聚焦于异常区域,同时保留其他token的全局感知能力。

  • 在ViT后九层中加入掩码引导机制(MGA),训练时将异常掩码转化为注意力引导。
  • 即使预测掩码不准,模型仍能聚焦大致区域。
  • 区域融合策略:从子图预测还原整图分类

由于每幅图中可能有多个异常区域,且部分区域是误检,作者提出面积加权融合策略,避免"平均投票"被噪声干扰:

  • 每个异常子图的预测结果按面积大小加权,得出整图预测。
  • 有效降低"误检子图"对整图判断的负面影响。

实验结果:性能全面领先多个主流方法

AnomalyNCD不仅理论设计合理,在实际效果上也具备明显优势。论文在两个权威工业数据集上进行了充分对比实验:

  • 在 MVTec AD 数据集(图像类别丰富,异常种类多)

仅使用未标注图像,与当前最强无监督聚类方法(AC)相比,NMI 提升 8.8%,F1 提升 10.8%(见表格1)。

结合一类检测器(如CPR)后,F1 高达 80.5%,比原方法高出近10个百分点(见表格2)。

  • 在 MTD 数据集(磁砖缺陷,异常更难区分)
  • 即使在伪标签干扰更强、语义更弱的场景中,仍然优于现有聚类方法,F1 提升高达 12.8%。
  • 使用 PatchCore 作为前置检测器,也取得比UniFormaly更优的结果。
  • 消融实验进一步验证模块有效性

引入主元素二值化(MEBin)后,F1 提升 7.2%,且在不同AD方法上均优于固定阈值方案。

掩码引导模块(MGA)在不同位置插入后,以"最后9层"为最佳配置(见表格5)。

伪标签修正策略(PLC)显著提升正常类识别的 recall(+14.9%)。

应用前景与意义

AnomalyNCD不仅兼容各种工业检测算法,还具备以下优势:

  • 可自动适应"未知"异常,减少人工标注负担;
  • 可用于复杂缺陷分类、视觉质检分流、智能决策等下游流程;
  • 框架可扩展性强,可结合YOLO、PatchCore等多种检测模块。

这意味着在未来的智能工厂中,算法不再只是"告诉你哪里坏了",而是能够进一步 "告诉你坏在哪、坏了什么" ,让生产更加高效、智能、少人工。

总结

AnomalyNCD的提出,标志着工业异常检测进入一个全新阶段:从"发现异常"迈向"理解异常"。这一框架不仅增强了AI在工业质检中的智能程度,也为NCD在低语义场景中的落地应用提供了重要示范。未来,类似的自监督与掩码机制将成为提升工业智能的关键武器。

相关推荐
Wendy14411 小时前
【边缘填充】——图像预处理(OpenCV)
人工智能·opencv·计算机视觉
今天也好累3 小时前
C 语言基础第16天:指针补充
java·c语言·数据结构·笔记·学习·算法
大千AI助手3 小时前
直接偏好优化(DPO):原理、演进与大模型对齐新范式
人工智能·神经网络·算法·机器学习·dpo·大模型对齐·直接偏好优化
zzywxc7875 小时前
AI 驱动的软件测试革新:框架、检测与优化实践
人工智能·深度学习·机器学习·数据挖掘·数据分析
徐小夕5 小时前
再也不怕看不懂 GitHub 代码!这款AI开源项目,一键生成交互架构图
前端·算法·github
Ronin-Lotus5 小时前
深度学习篇---PaddleDetection模型选择
人工智能·深度学习
Blossom.1186 小时前
基于深度学习的医学图像分析:使用CycleGAN实现图像到图像的转换
人工智能·深度学习·目标检测·机器学习·分类·数据挖掘·语音识别
SirLancelot16 小时前
数据结构-Set集合(一)Set集合介绍、优缺点
java·开发语言·数据结构·后端·算法·哈希算法·set
YouQian7726 小时前
label 拓扑排序
数据结构·算法
YouQian7726 小时前
(补题)小塔的饭
算法