【论文阅读 05】图像异常检测研究现状综述

1 图像异常检测任务

图像异常检测任务根据异常的形态可以分为定性异常的分类和定量异常的定位两个类别.

定性异常的分类:整体地给出是否异常的判断,无需准确定位异常的位置。

如图2左上图所示, 左侧代表正常图像, 右侧代表异常图像,

在第1行中,模型仅使用服饰数据集中衣服类型的样本进行训练,则其他类别的样本图像 (鞋子等) 对模型来说都是需要检测的异常样本, 因为他们在纹理、结构和语义信息等方面都不相同.

又或者如第2行所示, 异常图像中的三极管与正常图像之间只是出现了整体的偏移, 而三极管表面并不存在任何局部的异常区域, 难以准确地定义出现异常的位置, 更适合整体地进行异常与否的分类.

定量异常的定位 :类似于目标检测或者图像分割任务, 需要得到异常区域的位置信息.

测试图像中只有一小部分区域出现了异常模式. 而异常定位任务根据具体的图像背景又可分为以下几类,

均匀背景(磨砂玻璃表面对局部缺陷的定位 相对简单)、纹理背景、结构背景(医疗 相对较难)

2 图像异常检测技术

2.1 基于传统方法的异常检测技术

传统的图像异常检测算法大多会学习一个模型来描述正常图像, 随后在检测阶段根据待检图像与现有模型之间的匹配程度来进行异常检测.

2.1.1 基于模板匹配

最理想的情况是所有的正常图像都高度相似, 且异常图像与正常图像之间只会在小部分区域出现区别. 此时, 模板匹配是 非常有效的一类异常检测方法. 得到待测图像和模板图像之间的对应关系后, 比较两者之间的差异即可实现异常检测.

2.1.2 基于统计模型

2.1.3 基于图像分解

2.1.4 基于频域分析

2.1.5 基于稀疏编码重构

2.1.6 基于分类面构建

2.2 基于传统方法的异常检测技术

基于距离度量、基于分类面构建、基于图像重构和结合传统方法的异常检测方法

相关推荐
做cv的小昊5 分钟前
VLM经典论文阅读:【综述】An Introduction to Vision-Language Modeling
论文阅读·人工智能·计算机视觉·语言模型·自然语言处理·bert·transformer
m0_6501082421 小时前
PaLM-E:具身智能的多模态语言模型新范式
论文阅读·人工智能·机器人·具身智能·多模态大语言模型·palm-e·大模型驱动
m0_650108241 天前
PaLM:Pathways 驱动的大规模语言模型 scaling 实践
论文阅读·人工智能·palm·谷歌大模型·大规模语言模型·全面评估与行为分析·scaling效应
小殊小殊1 天前
【论文笔记】视频RAG-Vgent:基于图结构的视频检索推理框架
论文阅读·人工智能·深度学习
有点不太正常1 天前
《ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs》——论文阅读
论文阅读·大模型·agent安全
小殊小殊1 天前
【论文笔记】大型语言模型的知识蒸馏与数据集蒸馏
论文阅读·人工智能·深度学习
SatoshiGogo3 天前
AIGC 论文笔记
论文阅读·aigc
walnut_oyb3 天前
arXiv|SARLANG-1M:用于 SAR 图像理解的视觉-语言建模基准
论文阅读·人工智能·机器学习·计算机视觉·语言模型·自然语言处理
m0_650108244 天前
Gemini 2.5:重塑多模态 AI 边界的全面解读
论文阅读·人工智能·多模态大模型·gemini 2.5·跨模态融合
钟屿4 天前
Back to Basics: Let Denoising Generative Models Denoise 论文阅读学习
论文阅读·人工智能·笔记·学习·计算机视觉