金属材料表面六种缺陷类型数据集 | 适用于YOLO等视觉检测模型(1800张图片已划分、已标注)

金属材料表面六种缺陷类型数据集(1800张图片已划分、已标注)

本数据集聚焦于金属表面质量检测,包含6类典型缺陷,1800张图像,标注完整,已按 train/val/test 划分,并使用 YOLO项目格式进行标注,适用于目标检测、缺陷分类与工业视觉相关任务。

背景

金属材料在轧制、热处理、运输及长期使用过程中,常会产生各类表面缺陷,这些缺陷不仅降低外观质量,更可能影响其强度、疲劳寿命甚至安全性能。随着工业制造向自动化与智能化演进,基于深度学习的表面缺陷检测成为提升质量控制的重要手段。

然而,高质量、标注规范的数据集一直是算法研究中的瓶颈。因此,我们构建了此面向学术与工业的金属缺陷数据集,旨在推动智能检测系统在实际场景中的落地与优化。

数据集概述

  • 图像总数:1800张(已完成标注)

  • 标注格式:YOLO格式与COCO格式可相互转化

  • 图像尺寸:统一为640×640(可自定义缩放)

  • **划分:

    📂 训练集: 1260 📂 验证集: 360 📂 测试集: 180

  • 类别数量:6类

  • 类别配置(YOLO格式)

yaml 复制代码
nc: 6
names:
  0: crazing
  1: inclusion
  2: patches
  3: pitted_surface
  4: rolled-in_scale
  5: scratches

数据集详情

类别编号 类别名称 中文释义 特征描述
0 crazing 裂纹/龟裂 表面微裂纹,形似龟壳裂纹,多因材料老化或热处理不均导致
1 inclusion 杂质夹杂 材料中混入非金属杂质,外观呈点状或条状暗斑,影响材料纯度
2 patches 表面块状斑痕 局部表面区域发生变色或质地异常,可能与氧化或油污有关
3 pitted_surface 凹坑/腐蚀点 表面形成小孔或点蚀,通常是腐蚀或加工缺陷的结果
4 rolled-in_scale 轧入氧化皮 热轧过程中氧化皮卷入表层形成异色斑块,边缘不规则
5 scratches 划痕 线性划痕,由硬物刮擦形成,深浅不一,走向基本一致

所有缺陷都已使用边界框(bounding box)形式手动标注,适合用于 YOLO全系列、Faster R-CNN、RT-DETR 等检测模型的训练和评估。

适用场景

本数据集广泛适用于以下研究与工业应用:

  1. 工业缺陷检测模型训练 可直接用于训练YOLOv5、YOLOv8、RT-DETR等检测模型,用于实际部署或研究验证。
  2. 缺陷分类与分割任务 可对图像中心区域裁剪生成分类任务数据,或与语义分割工具配合进一步扩展。
  3. 算法对比与论文验证 适合用于不同检测网络的性能评估,支持标准化训练流程,有利于模型泛化性对比。
  4. 图像增强与合成学习研究 图像背景多样、缺陷类型复杂,适合作为生成对抗网络(GAN)或图像增强算法的输入。
  5. 工业自动化质检系统开发 可集成至边缘计算设备,实现对流水线上的金属件在线检测与报警。

完美适配检测任务,效果如下

实战配套项目

基于YOLOv8的6种金属表面缺陷检测识别项目【完整源码数据集+PyQt5界面+完整训练流程+开箱即用!】:blog.csdn.net/weixin_5290...

数据集分享

bash 复制代码
https://pan.baidu.com/s/1eltE8ewS4V1ONDGubsYJ4g?pwd=skr8 

结语

本数据集通过系统性地收集、整理和标注金属材料表面六类典型缺陷,填补了工业视觉领域在金属表面缺陷检测方向公开数据资源的空白。其在样本多样性、标注精度和场景适配性方面具有显著优势,不仅可作为深度学习算法的训练基准,也适用于真实工业质检系统的部署验证。

未来,我们将进一步扩展该数据集的规模和缺陷类别,加入语义分割、实例分割等多模态标注形式,支持更复杂的检测与识别任务。我们诚邀学术界与工业界的研究者在此基础上深入探索,共同推动智能制造与视觉质检技术的落地发展。

相关推荐
东临碣石8214 小时前
【AI论文】语言模型的变分推理方法
人工智能·语言模型·自然语言处理
文火冰糖的硅基工坊15 小时前
[创业之路-666]:第四次工业革命(智能革命)未来将创造大量的财富,普通人通过哪些方式参与这些财富的创造与分享?
人工智能·chatgpt·系统架构·产品运营·产业链
数智顾问15 小时前
AI自动化测试:接口测试全流程自动化的实现方法——从需求到落地的全链路实践
运维·人工智能·自动化
AI人工智能+15 小时前
表格识别技术:突破传统OCR的局限,通过定位-解析-重建三步策略攻克无边框、合并单元格等视觉难题
人工智能·深度学习·ocr·表格识别
夫子39616 小时前
【深度干货】Transformer推理优化完全指南:模型压缩、推理加速与硬件调优
人工智能·llm
Elastic 中国社区官方博客16 小时前
AutoOps:简化自管理 Elasticsearch 的旅程
大数据·人工智能·elasticsearch·搜索引擎·全文检索
chatexcel16 小时前
ChatExcel将发布数据分析Mini AI 工作站
大数据·人工智能·数据分析
HuggingFace16 小时前
Gaia2 与 ARE:赋能社区的智能体评测
人工智能
丁学文武16 小时前
大模型原理与实践:第三章-预训练语言模型详解_第1部分-Encoder-only(BERT、RoBERTa、ALBERT)
人工智能·语言模型·nlp·bert·roberta·大模型应用·encoder-only
攻城狮7号16 小时前
NVIDIA开源Audio2Face模型与SDK,数字人表情迎来“灵魂”时刻
人工智能·nvidia·开源模型·audio2face