VisualAD: Language-Free Zero-Shot Anomaly Detection via Vision Transformer

摘要

零样本异常检测(ZSAD)要求在无法获取目标类别异常样本的情况下检测并定位异常 。主流方法依赖于视觉-语言模型(VLM,例如 CLIP):它们为正常和异常语义构建手工设计或可学习的提示(Prompt)集,然后计算图像-文本的相似度以进行开集判别 。虽然这种范式很有效,但它依赖于文本编码器和跨模态对齐,这可能会导致训练不稳定和参数冗余 。本研究重新审视了 ZSAD 中文本分支的必要性,并提出了 VisualAD,这是一个建立在视觉 Transformer(ViT)基础上的纯视觉框架 。我们在冻结的主干网络中引入了两个可学习的 Token,直接对正常和异常进行编码 。通过多层自注意力机制,这些 Token 与图像块(Patch)Token 进行交互,在引导图像块突出异常相关线索的同时,逐渐获得关于正常和异常的高级概念 。此外,我们还结合了空间感知交叉注意力(SCA)模块和轻量级的自对齐函数(SAF):SCA 将细粒度的空间信息注入到 Token 中,而 SAF 则在进行异常评分之前对图像块特征进行重新校准 。VisualAD 在横跨工业和医疗领域的 13 个零样本异常检测基准数据集上均取得了最先进(SOTA)的性能,并且能够无缝适配预训练的视觉主干网络,如 CLIP 图像编码器和 DINOv2 。

she

设计了两个token 用来计算异常和正常的相似度。

相关推荐
__土块__16 小时前
AI 管理后台首页信息过载治理:从指标泛滥到决策摘要的视图重构实践
异常检测·可观测性·故障排查·信息架构·ai工程·管理后台设计·状态机建模
Rnan-prince7 天前
Node2Vec 从理论到工程:图嵌入驱动的文件系统异常检测实战
异常检测·图嵌入·node2vec
EDPJ11 天前
(2026|成电,超图,图文融合和对齐,高阶推理/将异常显式地推理为语义-结构一致性的违反)H2VLR:用于少样本异常检测的异构超图视觉语言推理
人工智能·计算机视觉·异常检测
Coovally AI模型快速验证17 天前
无人机拍叶片→AI找缺陷:CEA-DETR改进RT-DETR做风电叶片表面缺陷检测,mAP50达89.4%
人工智能·3d·视觉检测·无人机·异常检测·工业质检
quetalangtaosha18 天前
Anomaly Detection系列(CVPR2025 TAO论文解读)
人工智能·异常检测
Dfreedom.19 天前
异常检测算法详解:从“何为异常”到“如何发现”
人工智能·算法·机器学习·聚类·异常检测
quetalangtaosha24 天前
Anomaly Detection系列(CVPR2025 Odd-One-Out论文解读)
人工智能·计算机视觉·异常检测
quetalangtaosha25 天前
Anomaly Detection系列(CVPR2025 DeCo-Diff论文解读)
人工智能·计算机视觉·异常检测
Coovally AI模型快速验证1 个月前
YOLO训练可以偷懒?Anti-Forgetting Sampling跳过已学会的图片加速收敛
人工智能·yolo·视觉检测·异常检测·工业质检
这张生成的图像能检测吗1 个月前
(论文速读)基于混合学习的边缘计算物联网系统操作视觉质量检测
人工智能·深度学习·物联网·智能制造·异常检测