【无标题】如何使用yolo-v8 实现自定义目标检测

如何使用yolo-v8 实现自定义目标检测

训练数据集准备

在kaggle平台或者其他数据集的平台搜索相应的数据集,也可以自己拍摄大量的照片整理成数据集。

整理数据集的时候要注意数据标签的各式,必须是yolo-v8对应的格式,如果下载的数据集中自带的数据标签不是yolo-v8的格式(例如pascal voc),需要我们将数据格式转化为yolo-v8的格式

搭建环境

安装anaconda

复制代码
下载anaconda,清华源下载链接:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
在下载目录下找到对应版本(linux、mac、windows)的anaconda软件进行下载,下载之后按照常规的安装步骤将软件安装到主机上。

配置python虚拟环境

打开anaconda 的"anaconda prompt"命令行窗口

创建python3.8的虚拟环境:conda create -n myenv python=3.8

激活创建的虚拟环境:conda activate myenv

退出创建的虚拟环境:conda deactivate

安装yolo-v8以及labelimg图片标注工具

打开"anaconda prompt"命令行窗口,进入虚拟环境:

conda activate myenv

切换镜像源到清华源:

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/

pip config set install trusted-host pypi.tuna.tsinghua.edu.cn

安装yolo-v8:

pip install ultralytics

安装labelimg图片标注工具:

pip install labelimg

编写配置文件和训练脚本文件

编写yaml配置文件(文件名为dataset.yaml)

yaml 复制代码
# 训练数据路径
train: E:\Mypro\*****
# 验证数据路径
val: E:\Mypro\*****
# 测试数据路径
test: E:\Mypro\*****
# 目标种类数目
nc: 10
# 目标名称
# dog
# cat
# horse
names: ['dog','cat','horse']

编写模型训练代码(文件名称为yolotrain.py

python 复制代码
from ultralytics import YOLO  # 导入yolo模块
model = YOLO('yolov8n.pt')  # 用于加载yolo-v8的通用预训练模型
model.train(data='dataset.yaml',epochs=100)		# 加载上步编写的yaml配置文件,获取其中配置参数内容
model.val()		# 使用验证集验证效果

运行训练数据集获得模型

运行yolotrain.py开始训练模型,大概需要稍长时间具体由数据集大小而定,训练完成后会在当前目录下产生一个runs/detect/train目录,目录中weights目录中保存了训练好的模型文件best.pt和last.pt,一般使用best.pt进行目标识别应用。

测试训练好的数据模型

编写测试代码(文件名称yolotest.py

python 复制代码
from ultralytics import YOLO # 导入yolo模块
model = YOLO('best.pt')		# 加载训练好的模型
# 识别图片或者视频中的目标
model = predict('001.jpg',save=True)
model = predict('002.mp4', save=True)
# 只识别自己指定的0,1类别的目标,line_width表示识别框字体大小
model = predict('003.jpg',save=True,classes = [0,1],line_width = 30)
model = predict('004.mp4',save=True,classes = [0,1],line_width = 30)

运行测试程序获取结果

运行yolotest.py,识别结果保存在在当面目录下的runs/detect/predict中,打开图片或者视频文件就可以看到圈出来目标的图片或者视频文件。

相关推荐
wuk9988 小时前
MATLAB双树复小波变换(DTCWT)工具包详解
人工智能·计算机视觉·matlab
Petrichor_H_8 小时前
DAY 39 图像数据与显存
人工智能·深度学习
yumgpkpm9 小时前
数据可视化AI、BI工具,开源适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)值得推荐?
人工智能·hive·hadoop·信息可视化·kafka·开源·hbase
亚马逊云开发者9 小时前
通过Amazon Q CLI 集成DynamoDB MCP 实现游戏场景智能数据建模
人工智能
nix.gnehc9 小时前
PyTorch
人工智能·pytorch·python
J_Xiong01179 小时前
【VLNs篇】17:NaVid:基于视频的VLM规划视觉语言导航的下一步
人工智能·机器人
小殊小殊9 小时前
【论文笔记】视频RAG-Vgent:基于图结构的视频检索推理框架
论文阅读·人工智能·深度学习
IT_陈寒9 小时前
Vite 5.0实战:10个你可能不知道的性能优化技巧与插件生态深度解析
前端·人工智能·后端
大模型真好玩9 小时前
LangChain1.0实战之多模态RAG系统(二)——多模态RAG系统图片分析与语音转写功能实现
人工智能·langchain·mcp
机器之心10 小时前
智能体&编程新王Claude Opus 4.5震撼登场,定价大降2/3
人工智能·openai