【无标题】如何使用yolo-v8 实现自定义目标检测

如何使用yolo-v8 实现自定义目标检测

训练数据集准备

在kaggle平台或者其他数据集的平台搜索相应的数据集,也可以自己拍摄大量的照片整理成数据集。

整理数据集的时候要注意数据标签的各式,必须是yolo-v8对应的格式,如果下载的数据集中自带的数据标签不是yolo-v8的格式(例如pascal voc),需要我们将数据格式转化为yolo-v8的格式

搭建环境

安装anaconda

复制代码
下载anaconda,清华源下载链接:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
在下载目录下找到对应版本(linux、mac、windows)的anaconda软件进行下载,下载之后按照常规的安装步骤将软件安装到主机上。

配置python虚拟环境

打开anaconda 的"anaconda prompt"命令行窗口

创建python3.8的虚拟环境:conda create -n myenv python=3.8

激活创建的虚拟环境:conda activate myenv

退出创建的虚拟环境:conda deactivate

安装yolo-v8以及labelimg图片标注工具

打开"anaconda prompt"命令行窗口,进入虚拟环境:

conda activate myenv

切换镜像源到清华源:

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/

pip config set install trusted-host pypi.tuna.tsinghua.edu.cn

安装yolo-v8:

pip install ultralytics

安装labelimg图片标注工具:

pip install labelimg

编写配置文件和训练脚本文件

编写yaml配置文件(文件名为dataset.yaml)

yaml 复制代码
# 训练数据路径
train: E:\Mypro\*****
# 验证数据路径
val: E:\Mypro\*****
# 测试数据路径
test: E:\Mypro\*****
# 目标种类数目
nc: 10
# 目标名称
# dog
# cat
# horse
names: ['dog','cat','horse']

编写模型训练代码(文件名称为yolotrain.py

python 复制代码
from ultralytics import YOLO  # 导入yolo模块
model = YOLO('yolov8n.pt')  # 用于加载yolo-v8的通用预训练模型
model.train(data='dataset.yaml',epochs=100)		# 加载上步编写的yaml配置文件,获取其中配置参数内容
model.val()		# 使用验证集验证效果

运行训练数据集获得模型

运行yolotrain.py开始训练模型,大概需要稍长时间具体由数据集大小而定,训练完成后会在当前目录下产生一个runs/detect/train目录,目录中weights目录中保存了训练好的模型文件best.pt和last.pt,一般使用best.pt进行目标识别应用。

测试训练好的数据模型

编写测试代码(文件名称yolotest.py

python 复制代码
from ultralytics import YOLO # 导入yolo模块
model = YOLO('best.pt')		# 加载训练好的模型
# 识别图片或者视频中的目标
model = predict('001.jpg',save=True)
model = predict('002.mp4', save=True)
# 只识别自己指定的0,1类别的目标,line_width表示识别框字体大小
model = predict('003.jpg',save=True,classes = [0,1],line_width = 30)
model = predict('004.mp4',save=True,classes = [0,1],line_width = 30)

运行测试程序获取结果

运行yolotest.py,识别结果保存在在当面目录下的runs/detect/predict中,打开图片或者视频文件就可以看到圈出来目标的图片或者视频文件。

相关推荐
冬奇Lab3 小时前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐3 小时前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴3 小时前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风3 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
波动几何3 小时前
CDA架构代码工坊技能cda-code-lab
人工智能
舟遥遥娓飘飘3 小时前
DeepSeek V4技术变革对社会结构与职业体系的重构
人工智能
狐狐生风3 小时前
LangChain RAG 基础
人工智能·python·学习·langchain·rag·agentai
墨北小七4 小时前
使用InspireFace进行智慧楼宇门禁人脸识别的训练微调
人工智能·深度学习·神经网络
HackTorjan4 小时前
深度神经网络的反向传播与梯度优化原理
人工智能·spring boot·神经网络·机器学习·dnn
PersistJiao4 小时前
Codex、Claude Code、gstack三者的关系
人工智能