利用OpenCV 抽取视频的图片,并制作目标检测数据集

1、前言

目标检测中,图片的数据可以从视频中抽取,而OpenCV的VideoCapture可以实现这样的操作

需要的库文件 opencv

pip下载:

复制代码
pip install opencv-contrib-python

更换镜像源下载:

复制代码
pip install opencv-contrib-python -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
opencv-python: 只包含opencv库的主要模块. 一般不推荐安装.
opencv-contrib-python: 包含主要模块和contrib模块, 功能基本完整, 推荐安装.
opencv-python-headless: 和opencv-python一样, 但是没有GUI功能, 无外设系统可用.
opencv-contrib-python-headless: 和opencv-contrib-python一样但是没有GUI功能. 无外设系统可用.

2、利用OpenCV 抽取视频的帧图片

这里的代码很简单,具体的可以参考之前的文章:

OpenCV 视频处理(关于摄像头和视频文件的读取、显示、保存等等)-CSDN博客

mp4文件时待提取的视频文件

这里需要提取建立images文件夹,存放提取出来的图片

完整代码:

python 复制代码
import cv2


def image_capture(video_path,save_step,calc_video_info = True):
    video = cv2.VideoCapture(video_path)

    # 打印视频的信息
    if calc_video_info:
        fps = video.get(cv2.CAP_PROP_FPS)       # 视频的帧速率
        frame_num = video.get(cv2.CAP_PROP_FRAME_COUNT)     # 视频的总帧数
        frame_width = int(video.get(cv2.CAP_PROP_FRAME_WIDTH))  # 获取视频文件的帧宽度
        frame_height = int(video.get(cv2.CAP_PROP_FRAME_HEIGHT))  # 获取视频文件的帧高度

        print('Video fps is : ',fps)
        print('Video frame number is : ',frame_num)
        print('Video frame width is : ',frame_width)
        print('Video frame height is : ',frame_height)
        print('Video time is : ',int(frame_num/fps),'s')

    num = 0         # 帧总数
    num_images = 0
    while video.isOpened():
        ret,frame = video.read()
        if not ret:             # 没有读取到图片则退出
            break

        num +=1
        if num % save_step == 0:
            num_images +=1
            cv2.imwrite('./images/'+str(num)+'.jpg',frame)

    print('Total images is :',num_images)
    video.release()
    cv2.destroyAllWindows()


if __name__ == '__main__':
    root = 'test.mp4'       # 视频文件的路径
    step = 30 # 间隔多少帧读取图像

    image_capture(video_path=root,save_step=step)

结果展示:

这里的帧总数时1564,fps为25,代表一秒展示25张图片,所以总时长就是1564/25=62s

而我们每隔30帧抽取一张图片,因此1564/30 = 52,共抽取52张图片

代码很简单,可以对照注释自行查看即可

3、利用 labelimg 进行目标检测的标注

需要注意的是,labelimg支持python 3.9版本,建议新建虚拟环境:

python 复制代码
conda create -n name python=3.9

安装命令

python 复制代码
pip install labelimg

运行:

具体的可以参考,这里只简单介绍关于图像分类、目标检测和语义分割的Data Annotations_语义分割 annotations-CSDN博客

打开界面:

这里设置图像目录、保持的目录以及yolo保存格式就行了

右键新建边界框即可:

标注好如下:

单个txt文件:

这里面还有一个classes文本

相关推荐
晚霞的不甘32 分钟前
CANN 支持多模态大模型:Qwen-VL 与 LLaVA 的端侧部署实战
人工智能·神经网络·架构·开源·音视频
华玥作者7 小时前
[特殊字符] VitePress 对接 Algolia AI 问答(DocSearch + AI Search)完整实战(下)
前端·人工智能·ai
AAD555888997 小时前
YOLO11-EfficientRepBiPAN载重汽车轮胎热成像检测与分类_3
人工智能·分类·数据挖掘
王建文go7 小时前
RAG(宠物健康AI)
人工智能·宠物·rag
ALINX技术博客7 小时前
【202601芯动态】全球 FPGA 异构热潮,ALINX 高性能异构新品预告
人工智能·fpga开发·gpu算力·fpga
易营宝7 小时前
多语言网站建设避坑指南:既要“数据同步”,又能“按市场个性化”,别踩这 5 个坑
大数据·人工智能
春日见7 小时前
vscode代码无法跳转
大数据·人工智能·深度学习·elasticsearch·搜索引擎
Drgfd8 小时前
真智能 vs 伪智能:天选 WE H7 Lite 用 AI 人脸识别 + 呼吸灯带,重新定义智能化充电桩
人工智能·智能充电桩·家用充电桩·充电桩推荐
萤丰信息8 小时前
AI 筑基・生态共荣:智慧园区的价值重构与未来新途
大数据·运维·人工智能·科技·智慧城市·智慧园区
盖雅工场8 小时前
排班+成本双管控,餐饮零售精细化运营破局
人工智能·零售餐饮·ai智能排班