[数据集][目标检测]基于yolov5增强数据集算法mosaic来扩充自己的数据集自动生成增强图片和对应标注无需重新标注

【算法介绍】

YOLOv5最引人注目的增强技术之一是马赛克增强,它将四张不同的图像拼接成一张图像。

思路:首先,从数据集中随机选择四张图像,然后将它们缩放、随机裁剪,并按马赛克模式拼接在一起。这种方式允许模型看到多尺度的目标,并且增强了目标的背景多样性。

步骤:

  • 初始化整个背景图, 大小为(2 × image_size, 2 × image_size, 3)
  • 随机取一个中心点
  • 基于中心点分别将4个图放到左上,右上,左下,右下,,此部分可能会由于中心点小于4张图片的宽高
  • 所以拼接的时候可能会进行裁剪重新将打标边框的偏移量计算上

mosaic增强被认为是在传统增强算法最能提升模型性能的增强手段之一,因此研究了一下如何在已有数据集和标注情况下通过这个增强扩充自己的数据集,数据集扩展后,自动生成图片和对应标注,这样无需重新标注大大加快数据集集成能力。因此我实现了这个功能,而且效果很不错。

【效果展示】

标注情况:

【使用方法】

安装好opencv-python和pillow模块后,执行python main.py即可,main.py里面路径需要提前修改为自己对应路径

复制代码
from voc_mosaic_firc import *

if __name__ == '__main__':
    image_dir = r'E:\VOC2012\JPEGImages'  # 图片目录必须是.jpg格式
    xml_dir = r'E:\VOC2012\Annotations'  # 标注目录,里面有对应xml文件,voc格式
    save_dir = r'C:\Users\Administrator\Desktop\dataset'  # 保存目录
    generate_count = 5  # 生成数
    mm = MosaicManager()  # 构建对象
    mm.start(image_dir, xml_dir, save_dir, generate_count)  # 开始生成

【完整实现源码下载】

https://download.csdn.net/download/FL1623863129/89789898

相关推荐
FelixZhang0281 小时前
从 PDF 到 AI 知识库:RAG 数据预处理的六步标准流水线 (SOP)
人工智能·python·目标检测·计算机视觉·语言模型·ocr·numpy
盼小辉丶1 小时前
Transformer实战(38)——视觉Transformer (Vision Transformer, ViT)
深度学习·计算机视觉·transformer
Steiwe2 小时前
多模态大模型产生幻觉的直接原因是否是语言先验问题
人工智能·计算机视觉
papership2 小时前
【YOLOv8 完整 80 类物体清单】
yolo
乐园游梦记2 小时前
下载 Docker 镜像(CVAT)资源
人工智能·python·深度学习·yolo·机器学习·cvat
大江东去浪淘尽千古风流人物2 小时前
【Basaalt】Visual-Inertial Mapping with Non-Linear Factor Recovery论文解读
人工智能·计算机视觉
青瓷程序设计3 小时前
【基于 YOLO的咖啡豆果实成熟度检测系统】+ Python+算法模型+目标检测+2026原创
python·算法·yolo
兮℡檬,3 小时前
视觉几何(3D->2D,2D->3D)
人工智能·数码相机·计算机视觉
新缸中之脑3 小时前
Nano Banana 相机控制
人工智能·数码相机·计算机视觉
AI人工智能+3 小时前
基于OCR与大模型融合的文档抽取技术,可自动化完成证照信息抽取
人工智能·计算机视觉·语言模型·自然语言处理·ocr