DINOv2工业缺陷异常检测算特征提取模型介绍

DINO 是一种用于自监督视觉学习的深度学习模型,于 2021 年由 Facebook AI 提出。DINO 是最先探讨基于 Transformer 架构的自监督学习代表作之一,其通过在无标签图像上进行自监督训练来学习视觉特征表示。

DINOV2 (Distillation with No Labels version 2)是MetaAl开发的自监督视觉基础模型,基于Vision Transformer(ViT)架构,在1.42亿张无标注图像上训练,能生成无需微调即可直接用于下游任务的通用视觉特征。

DINOv2版本的链接地址为:https://github.com/facebookresearch/dinov2

1.工业缺陷检测的痛点

在制造业质检场景中,异常样本往往只占总数的0.1%-5%,却直接影响产品质量。传统监督学习需要大量标注数据,同时需要不停的进行数据迭代,需要消耗标注及数据清洗的人力和训练设备及电力。而DINOv2通过自监督学习在海量无标注图像上预训练,能够提取具有判别力的视觉特征,特别适合工业缺陷异常检测任务。采用的范式为"预训练+下游任务微调",本质上是知识的复用与迁移。

DINOv2基于Vision Transformer(ViT)架构,通过自注意力机制捕捉图像全局特征。采用了自监督学习的方法来从大量未标注的数据中学习有用的特征表示。其核心思想在于对比学习,即通过对同一张图片的不同变换版本进行编码,并尝试让这些变换后的表示尽可能相似,同时与其他图片的表示保持距离。这种策略使得模型能够在没有标签的情况下学习到图像中的语义信息。我们将使用预训练的ViT模型作为特征提取器,构建一个简单而高效的异常检测系统。

在当前计算机视觉领域的自监督预训练方法中,对比学习(Contrastive Learning)和掩码图像建模(Masked Image Modeling)最为流行,前者通过构建图像对及优化相似度度量来增强区分性表征能力,后者则通过重建遮蔽区域使模型学习通用图像特征。

2.环境及部署

将下载的文件解压导D:\DINO\dinov2-main文件夹下;并以管理员身份进入Anaconda powershell prompt命令栏下。如下图所示:

1)创建并激活虚拟环境

进入安装目录下,输入如下指令

bash 复制代码
#手动创建虚拟环境
conda create -n dinov2 python=3.12
conda activate dinov2
# 安装核心依赖
pip install torch torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install opencv-python pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

手动创建虚拟环境后,可参考文件conda-extras.yaml通过pip install 进行安装,如需加速可利用清华镜像源 -i https://pypi.tuna.tsinghua.edu.cn/simple进行安装。如下指令

bash 复制代码
pip install  torchmetrics -i https://pypi.tuna.tsinghua.edu.cn/simple
相关推荐
csdn_aspnet1 天前
如何用 C# 和 Gemma 3 在本地构建一个真正能完成工作的 AI 代理的
人工智能·ai·c#·gemma
啊哈哈哈哈哈啊哈哈1 天前
边缘计算与轮廓检测
人工智能·opencv·计算机视觉
cskywit1 天前
从DFL到无NMS推理:一文拆解YOLO26背后的工程取舍与数学原理
人工智能·机器学习
PPHT-H1 天前
【人工智能笔记】第四十四节:OpenClaw封神工具 openclaw-free-openai-proxy 免费AI模型批量调用,零token费+稳到不翻车!
人工智能·深度学习·openclaw·免费openai·ai服务代理
yiyu07161 天前
3分钟搞懂深度学习AI:实操篇:RNN
人工智能·深度学习
uzong1 天前
CoPaw是什么?-- 2026年开源的国产个人AI助手
人工智能·后端
海盗儿1 天前
TensorRT-LLM 框架与源码分析
人工智能
无心水1 天前
【任务调度:框架】11、分布式任务调度进阶:高可用、幂等性、性能优化三板斧
人工智能·分布式·后端·性能优化·架构·2025博客之星·分布式调度框架
码森林1 天前
小龙虾居然比你更健忘?OpenClaw 记忆系统指南,让它永远记住你
人工智能·ai编程·全栈
ghie90901 天前
维纳滤波器语音增强MATLAB实现
人工智能·matlab·语音识别