DINOv2工业缺陷异常检测算特征提取模型介绍

DINO 是一种用于自监督视觉学习的深度学习模型,于 2021 年由 Facebook AI 提出。DINO 是最先探讨基于 Transformer 架构的自监督学习代表作之一,其通过在无标签图像上进行自监督训练来学习视觉特征表示。

DINOV2 (Distillation with No Labels version 2)是MetaAl开发的自监督视觉基础模型,基于Vision Transformer(ViT)架构,在1.42亿张无标注图像上训练,能生成无需微调即可直接用于下游任务的通用视觉特征。

DINOv2版本的链接地址为:https://github.com/facebookresearch/dinov2

1.工业缺陷检测的痛点

在制造业质检场景中,异常样本往往只占总数的0.1%-5%,却直接影响产品质量。传统监督学习需要大量标注数据,同时需要不停的进行数据迭代,需要消耗标注及数据清洗的人力和训练设备及电力。而DINOv2通过自监督学习在海量无标注图像上预训练,能够提取具有判别力的视觉特征,特别适合工业缺陷异常检测任务。采用的范式为"预训练+下游任务微调",本质上是知识的复用与迁移。

DINOv2基于Vision Transformer(ViT)架构,通过自注意力机制捕捉图像全局特征。采用了自监督学习的方法来从大量未标注的数据中学习有用的特征表示。其核心思想在于对比学习,即通过对同一张图片的不同变换版本进行编码,并尝试让这些变换后的表示尽可能相似,同时与其他图片的表示保持距离。这种策略使得模型能够在没有标签的情况下学习到图像中的语义信息。我们将使用预训练的ViT模型作为特征提取器,构建一个简单而高效的异常检测系统。

在当前计算机视觉领域的自监督预训练方法中,对比学习(Contrastive Learning)和掩码图像建模(Masked Image Modeling)最为流行,前者通过构建图像对及优化相似度度量来增强区分性表征能力,后者则通过重建遮蔽区域使模型学习通用图像特征。

2.环境及部署

将下载的文件解压导D:\DINO\dinov2-main文件夹下;并以管理员身份进入Anaconda powershell prompt命令栏下。如下图所示:

1)创建并激活虚拟环境

进入安装目录下,输入如下指令

bash 复制代码
#手动创建虚拟环境
conda create -n dinov2 python=3.12
conda activate dinov2
# 安装核心依赖
pip install torch torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install opencv-python pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

手动创建虚拟环境后,可参考文件conda-extras.yaml通过pip install 进行安装,如需加速可利用清华镜像源 -i https://pypi.tuna.tsinghua.edu.cn/simple进行安装。如下指令

bash 复制代码
pip install  torchmetrics -i https://pypi.tuna.tsinghua.edu.cn/simple
相关推荐
用户17085428888535 分钟前
用 Codex + Huashu Design Skill,15 分钟做出设计师级别的演示文稿(PPT)
人工智能
Elastic 中国社区官方博客38 分钟前
Elasticsearch:智能搜索 - AI builder 及 skills
大数据·人工智能·elasticsearch·搜索引擎·ai·信息可视化·全文检索
陶陶然Yay40 分钟前
神经网络卷积层梯度公式推导
人工智能·深度学习·神经网络
luffy54591 小时前
spring-ai实现rag本地知识库
人工智能
阿里云大数据AI技术1 小时前
Agentic风控:Flink+Fluss+大模型构建Agent全链路风险感知与实时告警
人工智能·flink
用户79457223954131 小时前
一句话生成短视频:当 AI Skills 真正打通"创作流水线"
人工智能·github·ai编程
code 小楊1 小时前
Hermes Agent(爱马仕智能体)全面深度测评与OpenClaw对比分析
人工智能·开源
花椒技术1 小时前
聊聊AI协同编写【测试用例】这件事
人工智能·ai编程·测试
丷丩1 小时前
从“失忆工具“到“智能助手“:GeoAI平台的Agent架构演进
人工智能·架构·gis·空间分析·geoai
qq_411262421 小时前
四博 AI 智能音箱方案:基于 ESP32-S3 打造远场拾音、多网络接入、可二次开发的 AI 语音终端
网络·人工智能·智能音箱