YOLOv5目标检测

文章目录

  • 软硬件环境
  • 前言
  • 安装GPU环境
  • 安装pytorch的GPU版本
  • YOLOv5测试
  • v3.0版本
  • 参考资料

软硬件环境

  • ubuntu 18.04 64bit
  • anaconda with 3.7
  • nvidia gtx 1070Ti
  • cuda 10.1
  • pytorch 1.5
  • YOLOv5

前言

YOLOv4还没有退热,YOLOv5就已经来了!

6月9日,Ultralytics公司开源了YOLOv5,离上一次YOLOv4发布不到50天,不过这一次的YOLOv5是基于PyTorch实现的,而不是之前版本的darknet

根据官方给出的数字,YOLOv5的速度最快可以达到每秒140帧(FPS),但是权重文件只有YOLOv4的1/9,而且准确度更高。本次的发布的YOLOv5并不是一个单独的模型,而是一个模型家族,包括了YOLOv5sYOLOv5mYOLOv5lYOLOv5x,要求Python 3.7和PyTorch 1.5以上版本。

安装GPU环境

请参考之前的文章

ubuntu安装cuda

windows 10安装cuda和cudnn

安装pytorch的GPU版本

来到官网 Start Locally | PyTorch,根据自己的环境,进行选择,网站会给出相应的安装命令。我这里的环境是linuxpipcuda 10.1

复制代码
conda create -n pytorch python=3.7
conda activate pytorch
pip install torch==1.5.0+cu101 torchvision==0.6.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html
pip install ipython

安装完pytorch后,我们在ipython中查看安装的结果

复制代码
(pytorch) xugaoxiang@1070Ti:~/Works/github/yolov5$ ipython
Python 3.7.7 (default, May  7 2020, 21:25:33)
Type 'copyright', 'credits' or 'license' for more information
IPython 7.15.0 -- An enhanced Interactive Python. Type '?' for help.
In [1]: import torch
In [2]: torch.cuda.is_available()
Out[2]: True

说明GPU版本的pytorch安装成功

YOLOv5测试

首先还是把源码clone到本地

复制代码
pip install -U -r requirements.txt

下面就可以开始测试了

首先使用项目中自带的测试图片看看效果,命令是

复制代码
python detect.py

默认情况下,脚本会去读取inference/images下的所有图片并进行目标检测,带有目标框的结果图片保存在inference/out下。如果是只检测某一张图片的话,可以执行命令python detect.py --source test.jpg

为了对比测试,我们把YOLO之前版本的测试图片也跑了一遍

上图中马匹的检出率跟YOLOv4是一样的,满意

上图中右上角的垃圾桶没有被检出,这点不及YOLOv4

detect.py脚本同样支持视频的检测,包括本地摄像头、本地视频文件、m3u8播放地址和rtsp实时流,地址都是跟在参数--source后面

本地摄像头使用下面的命令

复制代码
python detect.py --source 0

基于rtsp的网络摄像头使用下面的命令

复制代码
python detect.py --source "rtsp://user:password@192.168.1.100:554/cam/realmonitor?channel=1&subtype=1"

可以看到,使用1070Ti显卡,fps在80左右

如果你有多块显卡,可以选择具体使用哪块显示进行检测,0表示第一块,1表示第二块,cpu表示不使用gpu

复制代码
python detect.py --device 0

detect.py中的参数很多,可以使用python detect.py -h进行查看

复制代码
(base) xugaoxiang@1070Ti:~/Works/github/yolov5$ python detect.py -h
usage: detect.py [-h] [--weights WEIGHTS] [--source SOURCE] [--output OUTPUT]
                 [--img-size IMG_SIZE] [--conf-thres CONF_THRES]
                 [--iou-thres IOU_THRES] [--fourcc FOURCC] [--device DEVICE]
                 [--view-img] [--save-txt] [--classes CLASSES [CLASSES ...]]
                 [--agnostic-nms] [--augment]
optional arguments:
  -h, --help            show this help message and exit
  --weights WEIGHTS     model.pt path
  --source SOURCE       source
  --output OUTPUT       output folder
  --img-size IMG_SIZE   inference size (pixels)
  --conf-thres CONF_THRES
                        object confidence threshold
  --iou-thres IOU_THRES
                        IOU threshold for NMS
  --fourcc FOURCC       output video codec (verify ffmpeg support)
  --device DEVICE       cuda device, i.e. 0 or 0,1,2,3 or cpu
  --view-img            display results
  --save-txt            save results to *.txt
  --classes CLASSES [CLASSES ...]
                        filter by class
  --agnostic-nms        class-agnostic NMS
  --augment             augmented inference

v3.0版本

很多朋友反应,在执行python detect.py时出现下面的错误

这个错误是由于YOLOv5源码与权重文件的不匹配引起的,升级到匹配的权重文件就好

相关推荐
染指11101 天前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
闵孚龙1 天前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python
甲维斯1 天前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件1 天前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
专注搞钱1 天前
GPT-4o写设备Recipe:从3小时到10分钟
数据库·人工智能·gpt·半导体
闻道参看1 天前
贝芯宠AI灵兽 ELFVET 大模型聚焦临床应用,强化宠物诊疗综合能力
人工智能·宠物
MartinYeung51 天前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型
财经资讯数据_灵砚智能1 天前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m0_380167141 天前
加密货币价格 API、市场数据 API 与 分析 API 有什么区别?
人工智能·ai·区块链
zyplayer-doc1 天前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新