使用pycharm+opencv进行视频抽帧(可以用来扩充数据集)+ labelimg的使用(数据标准)

一.视频抽帧

1.新创建一个空Pycharm项目文件,命名为streach zhen

注:然后要做一个前期工作 创建opencv环境

(1)我们在这个pycharm项目的终端里面输入下面的命令:

python 复制代码
pip install opencv-python --user -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install opencv-contrib-python --user -i https://pypi.tuna.tsinghua.edu.cn/simple

这里可能会报错:如果你用的是base环境,那么原样输入上面两个命令。如果创建的是虚拟环境,把上面两条语句中的--user去掉。

(2)使用一个测试python文件看看安装好了没有

·创建一个新的python文件,命名为test.py(注:这个截图里面的其他文件夹是后面创建的,可以先不管)

·这个test.py里面复制下面这个语句,看看有没有报错问题。没有就安装好了

python 复制代码
import cv2 as cv

src = cv.imread("D:/desk.jpg")
cv.namedWindow("input image",cv.WINDOW_AUTOSIZE)
cv.imshow("input image",src)
cv.waitKey(0)
cv.destroyAllWindows()
print("hi python")

2.将一个预先找好的mp4文件(这里用的是这个BVN.mp4)复制粘贴进这个文件夹里面

(注:这个截图里面的其他文件夹是后面创建的,可以先不管)

我跟着B站博主做的,这个mp4文件可以在大佬的github里面找到,大家可以自己在里面下载

3.在终端输入:

复制代码
jupyter notebook

网页端会自动打开(如图所示)

4.New一个.ipynb文件 ,打开它(自己照着敲一遍)

注意,在第13行代码的最后,我们把这个mp4里面抽的帧放在了image这个文件夹下面,我跟着博主做的时候,博主用的vscode,会自动生成images这个文件夹,但是我的不行,在jupyter里面运行对于语句之后虽然没有报错,但是发现pycharm项目里面没有新生成一个images文件夹(里面应该存放的是很多抽出来的帧图片)。问了同义千文,发现需要自己在pycharm项目下创建一个images的文件夹,不然它找不到。

咱就是说一整个大成功!

二.使用labelimg

1.在终端输入:

python 复制代码
pip install labelimg
labelimg

会自动打开这个小窗口。爱了爱了!

2.使用事项

右键

快捷键:A 上一张 D下一张 W快速创建框

接下来就是体力活儿了

3.数据调整

在images文件夹里面新建两个文件夹

·train

·val

300-480放到val里面去,其余的放到train里面去

labels文件也同上操作 (注意:class文件不要放进去)

4.把labels和images都放到一个datasets文件夹下面,然后把这个datasets文件夹复制粘贴到我们的yolo项目下面去。这个yolov5-master是在官方github下面下载的,里面的环境配置可以自行搜索怎么配。CSDN上面有很多,我之前的博客里面也有,这里不再赘述。

5.修改data里面的数据集描述文件,我们直接复制一份coco128.yaml,并且重命名为BVN.yaml,然后在里面改参数

6.train.py里面把这里改了

7.运行train.py

又是一个大成功!!

相关推荐
染指111011 小时前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
闵孚龙11 小时前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python
甲维斯12 小时前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件12 小时前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
专注搞钱13 小时前
GPT-4o写设备Recipe:从3小时到10分钟
数据库·人工智能·gpt·半导体
闻道参看13 小时前
贝芯宠AI灵兽 ELFVET 大模型聚焦临床应用,强化宠物诊疗综合能力
人工智能·宠物
MartinYeung513 小时前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型
财经资讯数据_灵砚智能13 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m0_3801671413 小时前
加密货币价格 API、市场数据 API 与 分析 API 有什么区别?
人工智能·ai·区块链
zyplayer-doc14 小时前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新