智能手机表面缺陷识别检测数据集 yolo数据集 1300张

智能手机表面缺陷识别检测数据集 yolo数据集 1300张

数据集名称

智能手机表面缺陷识别检测数据集(Smartphone Surface Defect Recognition Dataset)

数据集概述

该数据集是针对智能手机表面常见缺陷进行自动检测而专门构建的,主要应用于生产线上产品的质量控制或者售后服务部门的产品维修。数据集包含1300张高清图像,每张图像都有详细的YOLO格式标注,覆盖了8种类型的缺陷,包括破碎玻璃、芯片、裂纹、凹痕、缺失部件、剥落、点蚀、划痕和磨损。数据集具有良好的多样性和代表性,可帮助研究人员和工程师开发出高效的缺陷检测算法,提升产品质量和客户满意度。

数据集特点
  • 丰富多样的缺陷类型:涵盖8种常见的智能手机表面缺陷,满足实际应用的需求。
  • 大量标注图像:总共1300张图像,保证了足够的训练数据量。
  • 标准YOLO格式:所有图像都带有YOLO格式的标注,易于与其他YOLO框架配合使用。
  • 全面的缺陷分类:每个缺陷类别均有足够数量的实例,有利于模型的训练和泛化。
  • 真实场景:图像来源于真实的智能手机产品,反映了实际情况下的缺陷分布。
  • 数据集划分:数据集可能已按一定比例分为训练集、验证集和测试集,具体划分方式取决于数据集发布方的设计。
数据集构成
  • 图像数量:1300张
  • 类别数
    • broken_glass:154个实例
    • chip:69个实例
    • crack:674个实例
    • dent:463个实例
    • missing_part:2个实例
    • peel:26个实例
    • pitting:147个实例
    • scratch:3036个实例
    • water_damage:33个实例
    • wear_and_tear:8个实例
数据集用途
  • 缺陷检测算法开发:利用数据集训练和优化缺陷检测算法,提高检测准确度和速度。
  • 生产线质量控制:将训练好的模型部署到生产线上,实现自动化的缺陷检测,降低人工成本。
  • 售后维修服务:帮助售后服务中心快速判断和处理客户的设备问题,提高服务质量。
  • 性能评估:作为基准数据集,对比不同算法或模型的性能差异。
  • 研究与开发:支持学术界和工业界的缺陷检测研究,推动技术创新。
  • 教育与培训:作为教学材料,帮助学生了解实际应用场景下的机器学习问题解决过程。
示例代码

以下是一个简单的Python脚本示例,用于加载数据集中的一对图像-标签对,并可视化其中的标注信息:

import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle

# 数据集目录路径
data_dir = 'path/to/smartphone_defect_dataset'
train_image_dir = os.path.join(data_dir, 'images/train')
train_label_dir = os.path.join(data_dir, 'labels/train')

# 选取一张训练图像及其对应标签
image_files = os.listdir(train_image_dir)
image_file = image_files[0]  # 假设取第一张图
label_file = os.path.splitext(image_file)[0] + '.txt'

image_path = os.path.join(train_image_dir, image_file)
label_path = os.path.join(train_label_dir, label_file)

# 加载图像
image = cv2.imread(image_path, cv2.IMREAD_COLOR)
height, width, _ = image.shape

# 解析YOLO格式标签
def parse_yolo_label(label_path, image_width, image_height):
    bboxes = []
    with open(label_path, 'r') as f:
        lines = f.readlines()
        for line in lines:
            class_id, x_center, y_center, box_width, box_height = map(float, line.strip().split())
            x_min = int((x_center - box_width / 2) * image_width)
            y_min = int((y_center - box_height / 2) * image_height)
            box_width = int(box_width * image_width)
            box_height = int(box_height * image_height)
            bboxes.append((class_id, x_min, y_min, box_width, box_height))

    return bboxes

# 解析标签
bboxes = parse_yolo_label(label_path, width, height)

# 可视化标注
fig, ax = plt.subplots(figsize=(10, 10))
ax.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
colors = ['red', 'blue', 'green', 'orange', 'purple', 'yellow', 'pink', 'brown']
names = ['broken_glass', 'chip', 'crack', 'dent', 'missing_part', 'peel', 'pitting', 'scratch', 'water_damage', 'wear and tear']

for bbox, color_name in zip(bboxes, colors):
    class_id, x, y, w, h = bbox
    rect = Rectangle((x, y), w, h, linewidth=2, edgecolor=color_name, facecolor='none')
    ax.add_patch(rect)
    ax.text(x, y - 10, names[int(class_id)], color=color_name, fontsize=8)

plt.title('Smartphone Surface Defect Detection')
plt.axis('off')
plt.show()
数据集结构示例
├── smartphone_defect_dataset
│   ├── images
│   │   ├── train
│   │   │   ├── 00000.jpg
│   │   │   ├── 00001.jpg
│   │   │   └── ...
│   │   ├── validation
│   │   │   ├── 00000.jpg
│   │   │   ├── 00001.jpg
│   │   │   └── ...
│   │   └── test
│   │       ├── 00000.jpg
│   │       ├── 00001.jpg
│   │       └── ...
│   ├── labels
│   │   ├── train
│   │   │   ├── 00000.txt
│   │   │   ├── 00001.txt
│   │   │   └── ...
│   │   ├── validation
│   │   │   ├── 00000.txt
│   │   │   ├── 00001.txt
│   │   │   └── ...
│   │   └── test
│   │       ├── 00000.txt
│   │       ├── 00001.txt
│   │       └── ...
│   └── data.yaml  # 包含数据集的基本信息如类别数及类别名
相关推荐
weixin_468466852 天前
医学影像数据集汇总分享
深度学习·目标检测·数据集·图像分割·机器视觉·医学影像·ct影像
数据岛13 天前
大模型应用的数字能源数据集
大数据·数据分析·数据集·能源
知来者逆16 天前
Octo—— 基于80万个机器人轨迹的预训练数据集用于训练通用机器人,可在零次拍摄中解决各种任务
人工智能·机器学习·机器人·数据集·大语言模型
数据猎手小k17 天前
EmoAva:首个大规模、高质量的文本到3D表情映射数据集。
人工智能·算法·3d·数据集·机器学习数据集·ai大模型应用
数据猎手小k20 天前
GEOBench-VLM:专为地理空间任务设计的视觉-语言模型基准测试数据集
人工智能·语言模型·自然语言处理·数据集·机器学习数据集·ai大模型应用
dundunmm20 天前
论文阅读之方法: Single-cell transcriptomics of 20 mouse organs creates a Tabula Muris
论文阅读·数据挖掘·数据集·聚类·单细胞·细胞聚类·细胞测序
数据猎手小k20 天前
BioDeepAV:一个多模态基准数据集,包含超过1600个深度伪造视频,用于评估深度伪造检测器在面对未知生成器时的性能。
人工智能·算法·数据集·音视频·机器学习数据集·ai大模型应用
数据猎手小k21 天前
HNTS-MRG 2024 Challenge:是一个包含200个头颈癌病例的磁共振图像及其标注的公开数据集,旨在推动AI在头颈癌放射治疗自动分割领域的研究。
人工智能·数据集·机器学习数据集·ai大模型应用
数据猎手小k1 个月前
OSPTrack:一个包含多个生态系统中软件包执行时生成的静态和动态特征的标记数据集,用于识别开源软件中的恶意行为。
数据集·开源软件·机器学习数据集·ai大模型应用
HyperAI超神经1 个月前
NeurIPS 2024 有效投稿达 15,671 篇,数据集版块内容丰富
人工智能·开源·自动驾驶·数据集·多模态·化学光谱·neurips 2024