突破异常数据瓶颈！AnomalyAny：一句话+一张图，零样本生成任意异常图像

【导读】

在工业制造、食品质检、自动驾驶等场景中，异常检测（Anomaly Detection, AD）被广泛应用。但现实中的异常数据稀缺，导致训练高质量检测模型变得非常困难。>>更多资讯可加入CV技术群获取了解哦~

本文将为你介绍一项来自EPFL、ETH Zurich和华中科技大学联合发布的新工作 ------ Anomaly Anything (AnomalyAny)，它不需要训练、不依赖异常数据，仅靠一张正常图像和一句文字描述，就能生成高质量的"假异常图像"，有效辅助模型训练，在多个数据集上大幅提升性能。

一、异常检测为何困难重重

在异常检测任务中，我们最常见的挑战就是------异常数据少而杂：

异常本身极少： 在大规模生产线中，正常品数十万、百万级，但异常品可能只有个位数、甚至一个都没有。
异常类型多变： 不同产品、工艺、批次之间异常形式五花八门，比如划痕、破损、锈蚀、变形等，难以预定义所有类型。

此外，精确标注异常图代价高昂，且人工一致性低。

因此，大部分方法只能采用"无监督"或"仅用正常图"的方式训练。但这类模型常常缺乏对"异常是什么"的真正理解，泛化性较差。

二、AnomalyAny：用一张图+一句话，构造任意异常样本

AnomalyAny 是一个新颖的图像生成框架，目标是解决这样一个问题：如何在完全没有异常样本的情况下，生成逼真的、具备多样性的异常图像？

它的核心理念非常简单：

给它一个"正常样本"，再给它一句"异常描述"，它就能生成带有指定异常的图像版本，甚至还能给出像素级标注。

具体实现上，它建立在Stable Diffusion（稳定扩散模型） 的强大图像生成能力之上，创新性地提出了三项技术：

测试时条件引导(Test-time Conditioning)

通过将正常图像编码为隐空间中的特征，作为"起点"，引导SD在这个基础上生成图像，确保新图仍保留原物体的结构和外观。

注意力引导优化(Attention-guided Optimization)

利用SD的"交叉注意力机制"，强化对"异常关键词"（如damaged、rusted）的聚焦区域，提升异常生成的相关性与真实性。

借助GPT-4生成更丰富的异常描述（如"瓶身中部有一道深刻划痕，露出内部银白色金属"），并通过CLIP计算图文语义一致性，进一步提升图像细节与语义精度。

整个过程无需重新训练模型，完全在生成推理阶段完成，做到真正意义上的"即插即用"。

三、实验验证

研究者在两个工业视觉标准数据集上进行了大量实验MVTec AD ：涵盖15种常见工业品（瓶子、螺母、皮革等），VisA：包含12类包装食品图像（如苹果、玉米、绿豆等），这两个数据集都提供像素级的异常标注，用于检验模型的检测能力。

图像生成质量更高

作者采用两项指标评估合成图像的质量和多样性：

Inception Score（IS）: 衡量生成图像的真实性，AnomalyAny 在多数类别中得分最高（如 bottle 类别 IS=1.73，远超基线方法），表明其生成的异常样本更接近真实图像。

Intra-cluster LPIPS 距离（IC-LPIPS）: 衡量多样性，AnomalyAny 生成的异常样本差异更大（如 cable 类别 IC-LPIPS=0.41），为检测模型提供了更丰富的训练信号。

结果显示，AnomalyAny在平均IS和IC-LPIPS上全面领先，明显优于当前主流方法（如NSA、RealNet、AnomalyDiffusion）：

辅助检测效果显著提升

作者进一步用生成的图像训练异常检测模型，在 "1-shot设置"（每类仅1张正常图，无任何异常图） 下评估性能。

使用五个指标衡量性能（包括图像级AUC、像素级AUC、最大F1等），对比方法涵盖：

PaDiM、PatchCore（全监督方法）
PromptAD、WinCLIP、AnomalyGPT（CLIP系列方法）
DRAEM、NSA、RealNet（生成方法）

在MVTec AD和VisA上，AnomalyAny都在多个指标上刷新SOTA：

更重要的是，AnomalyAny不依赖任何异常样本，真正体现了"少样本甚至零样本"场景下的强大实用性！

四、结语：让"异常"不再难求

AnomalyAny并不仅仅是一个论文模型，它具备极强的实用与拓展性，适合部署在实际场景中：

工业检测： 检测新零件、新材料的潜在缺陷样式。
农业与食品检测： 合成发霉、变色、腐烂等细粒度异常图像。
视觉教学演示： 制作各种"缺陷"教材，训练或测试模型。
低资源环境部署前训练： 先"造"出千百种缺陷样本，提前训练好模型。

AnomalyAny给我们带来了一个全新的视角：异常不再是"可遇不可求"的数据短板，而是可以通过理解与生成"主动制造"的资源。

未来的异常检测系统，不再被数据稀缺卡住脖子------你可以用一句话+一张图，快速打造出"你的异常数据"。

想进一步了解或试用AnomalyAny，访问项目主页：

hansunhayden.github.io/