YOLOv5实战记录03 数据集构建

个人打卡,慎看。

指路大佬:【手把手带你实战YOLOv5-入门篇】YOLOv5 数据集构建_哔哩哔哩_bilibili

一、数据收集

  1. 图片类型数据
  2. 视频类型数据【使用opencv进行视频抽帧】

利用jupyter抽取帧并显示出来:

python 复制代码
import cv2
import matplotlib.pyplot as plt

video = cv2.VideoCapture("./192.mp4") #打开视频文件
ret,frame=video.read() #读取一帧

plt.imshow(frame)
#默认读取的是BGR格式

plt.imshow(cv2.cvtColor(frame,cv2.COLOR_BGR2RGB))
#设置读取格式为RGB

抽取一个视频里多个帧:【此处省略了import】

python 复制代码
video = cv2.VideoCapture("./192.mp4") #打开视频文件

num=0 #计数帧
save_step=30 #间隔帧
#每间隔save_step个帧后,捕获当前帧。 因为很多视频前后的帧是相似,
#没有太大差距,所以设置了间隔。

while True:
    ret,frame=video.read()
    if not ret:
        break
    num+=1
    if num% save_step==0:
       cv2.imwrite("./images/"+str(num)+".jpg",frame)

#这里没有利用RGB转换,仍然是正常的。为什么? 
#我们观察一下上面的代码,第一个是plt.imshow,这是利用plt打开图片,
#plt默认获取的格式是BGR。而这里cv2.imwrite是捕捉视频帧,直接存储到文件夹里,
#没有利用cv,plt打开图片。

二、标注工具labelimg

打开anaconda prompt,激活conda activate yolov5后输入以下指令

python 复制代码
pip install labelimg #下载labelimg包

然后输入labelimg,打开labelimg工具,进行标注。

  1. 选择Open Dir可以打开文件夹。labelimg会获取文件夹下的所有图片文件。
  2. save format设置成YOLO 【按键在Save下面,默认pascalVOC】
  3. 右键图片,选择Create RectBox。即可任意框住图像,设置label。注意保存。会提示选择一个文件夹用于存放label。
  4. 快捷键:a可以切换到上一张图片, d可以切换到下一张图片,w快速创建RectBox
  5. 点击View,选择Auto Save mode可以自动保存。【不过我的还是得ctrl+s才可以保存】
  6. 打开存放label的文件夹,我们会看到classes.txt文件和其他与图片同名的txt文件。前者保存了设置的label种类信息,后者保存了每个图片设置的label框选位置。

疑问:为什么是import cv2而不是 import opencv

"cv2"中的"2"并不表示opencv的版本号。OpenCV是基于C/C++的,"cv"和"cv2"分别利用底层C API和C++API。这主要是一个历史遗留问题,是为了保持向后兼容。

相关推荐
山半仙xs42 分钟前
pointNet做点云的分割和分类
人工智能·yolo·分类·自动驾驶·视觉检测
7yewh10 小时前
jetson_yolo_deployment 01_linux_dev_env
linux·嵌入式硬件·yolo·机器人·嵌入式
小趴蔡ha19 小时前
如何将XML格式标注文件转换为YOLO格式进行目标检测训练(附代码)
xml·yolo·目标检测
彭祥.20 小时前
基于PaddleSeg与YOLO的自动标注工具
yolo·paddle
白宇横流学长21 小时前
基于 YOLO 的宠物识别系统的设计与实现设计与实现【源码+文档】
yolo·宠物
7yewh2 天前
jetson_yolo_deployment 02_linux_dev_skills
linux·python·嵌入式硬件·yolo·嵌入式
极智视界2 天前
目标检测数据集 - 汽车损坏检测数据集下载
yolo·目标检测·数据集·voc·coco·算法训练·汽车外观损坏检测
kisshuan123962 天前
DRFD深度感受野下采样改进YOLOv26三路径特征融合
yolo
ASD123asfadxv2 天前
倒残差移动块与滑动窗口注意力改进YOLOv26局部感知与全局建模双重突破
人工智能·yolo·目标跟踪
gc_22992 天前
C#调用Microsoft.ML.OnnxRuntime和YOLO5模型时的输入数据格式分析
yolo·c#·数据预处理