YOLOv10(1):初探,训练自己的数据

目录

[1. 写在前面](#1. 写在前面)

[2. 值得关注的点](#2. 值得关注的点)

[3. 训练自己的数据集](#3. 训练自己的数据集)

[4. 阅读代码的小建议](#4. 阅读代码的小建议)


1. 写在前面

很多人YOLOv9还没有完全研究透,YOLOv10出来了。

惊不惊喜,意不意外!

据论文里提到,YOLOv10就是为了加速推理,在保证精度的同时,降低参数量,减小计算量。就冲这,还没有研究YOLOv9的同学们,直接跳过吧。

先说一句,如果大家不想动手,请不要客气,直接找我拿改动过的代码。

2. 值得关注的点

论文提到,YOLOv10的研究团队为 YOLO 提出了整体效率 - 准确率驱动的模型设计策略,从效率和准确率两个角度全面优化 YOLO 的各个组件,大大降低了计算开销并增强了模型能力。研究过ELAN的同学有没有似曾相识的感觉,通过预设某种策略来设计网络,听上去和理解上去都很玄学,但是,对于我们这种本着用好就可以的同学,有用就是硬道理。

此外,通过大量实验表明,YOLOv10 在各种模型规模上都实现了 SOTA 性能和效率。例如,YOLOv10-S 在 COCO 上的类似 AP 下比 RT-DETR-R18 快 1.8 倍,同时参数数量和 FLOP 大幅减少。与 YOLOv9-C 相比,在性能相同的情况下,YOLOv10-B 的延迟减少了 46%,参数减少了 25%。再一次划重点,可以先跨过YOLOv9,直接开搞YOLOv10。

通过消除NMS 的依赖性,通过利用空间通道解耦下采样排序指导的模块设计优化模型架构设计,YOLOv10在实时端到端目标检测领域具有重要意义。

3. 训练自己的数据集

(1)构造训练集

YOLOv10所需要的训练数据集制式和YOLOv8、YOLOv9都是一样的,因此只要构建过YOLOv8、YOLOv9训练数据集的同学应该不会感觉到难。

如果有对数据集制作有疑问的同学,可以私信我。

(2)做一些微小的改动

YOLOv10的训练工作在开头的时候有些难,尤其是如果大家在README.md文件中看到如下内容的时候。

不要担心,你只需要改动几个文件的几行代码,就可以以更轻松、更优雅的姿势开启训练。

第一步,修改配置文件

修改ultralytics\cfg\default.yaml文件,设置好model和data,如下所示。

第二步,添加训练入口

在ultralytics\models\yolov10\train.py文件中添加训练入口,具体的就是构建一个YOLOv10DetectionTrainer,然后开始训练。具体代码参考如下。

请注意,以下图中有两点需要注意。

M0:添加路径;

M1:添加训练入口;

第三步,开始训练吧

进入./yolov10-main/ultralytics/models/yolov10路径。

执行python3 train.py开始训练吧。

4. 阅读代码的小建议

YOLOv10和YOLOv8的代码结构略有相似。

我们将整个代码结构划分为三条线,分别是Trainer、Model和YOLO。其实Model线和YOLO线是一样的,都是构建模型相关的东西。Trainer则是构建训练相关的内容。

Trainer的继承关系

BaseTrainer - > DetectionTrainer -> YOLOv10DetectionTrainer

通过实例化YOLOv10DetectionTrainer,来构建整体的训练脉络。

Model的继承关系

task.py: BaseModel(nn.Module)

task.py: DetectionModel(BaseModel)

task.py: YOLOv10DetectionModel(DetectionModel)

YOLO的继承关系

engine/model.py: class Model(nn.Module)

yolo/model.py: class YOLO(Model)

yolov10/model.py: class YOLOv10(YOLO)

在YOLOv10DetectionTrainer中重载了get_model接口,用来实例化一个YOLOv10DetectionModel对象,开启训练。

相关推荐
sali-tec3 小时前
C# 基于halcon的视觉工作流-章29-边缘提取-亚像素
开发语言·图像处理·算法·计算机视觉·c#
坐在地上想成仙10 小时前
计算机视觉(4)-相机基础知识恶补
人工智能·数码相机·计算机视觉
AI模块工坊11 小时前
IEEE 2025 | 重磅开源!SLAM框架用“法向量+LRU缓存”,将三维重建效率飙升72%!
人工智能·深度学习·神经网络·机器学习·计算机视觉
cver12312 小时前
人脸情绪检测数据集-9,400 张图片 智能客服系统 在线教育平台 心理健康监测 人机交互优化 市场研究与广告 安全监控系统
人工智能·安全·yolo·计算机视觉·目标跟踪·机器人·人机交互
坐在地上想成仙15 小时前
计算机视觉(7)-纯视觉方案实现端到端轨迹规划(思路梳理)
人工智能·计算机视觉
坐在地上想成仙16 小时前
计算机视觉(8)-纯视觉方案实现端到端轨迹规划(模型训练+代码)
人工智能·计算机视觉
cver12319 小时前
垃圾分类检测数据集-15,000 张图片 智能垃圾分类 回收站与环保设施自动化 公共区域清洁监测 环保机器人 水域与自然环境垃圾监测
人工智能·计算机视觉·分类·数据挖掘·机器人·自动化·智慧城市
元让_vincent21 小时前
论文Review 激光动态物体剔除 Dynablox | RAL2023 ETH MIT出品!
人工智能·计算机视觉·目标跟踪·机器人·自动驾驶·点云·动态物体剔除
计算机sci论文精选21 小时前
CVPR 2025 | 视觉感知新突破丨PF3Det、SemiDAViL与3D物体功能定位的创新点合集
人工智能·深度学习·机器学习·计算机视觉·3d·视觉检测·cvpr
CoovallyAIHub21 小时前
YOLOVision 2025 官宣日期!大会议程暗藏 YOLOv14 发布信号?
深度学习·算法·计算机视觉