YOLOv8训练好模型后,追加轮数继续训练、或者提前终止训练,缩减训练轮数

一、前言

而且此教程适用的情况是你已经训练好了此模型,想继续追加一些轮数。比如训练进度是120/120,已经完成了,继续追加10轮,或者你原先定的是200轮,希望缩减到150轮,可以使用我说的这个方法。为什么缩减也要改一些东西呢?我直接不训练了不就可以了吗?这是因为没有训练完所有epoch,不会输出P、PR曲线等指标;或者说你不想一直盯着看,希望准确地缩减到某轮数,自动停止。

如果你不需要追加训练,只想缩减训练,那么直接看这个博客即可:YOLOv8断点恢复、减少训练轮数、提前终止。这篇博客是本篇博客的一个子集。如果想追加,那下面这些必须全都做。也就是说,项追加训,必须得先实现删减轮数的功能...

以下内容全在trainer.py中进行。前言这部分讲原理,如果不想看,可以直接看二部分。

1.对一个已经训练好的模型,也就是规定100轮,然后也训练了100轮,做了下实验:

python 复制代码
    def resume_training(self, ckpt):
        """Resume YOLO training from given epoch and best fitness."""
        if ckpt is None:
            return
        best_fitness = 0.0
        ...
        start_epoch = ckpt["epoch"] + 1
        print(ckpt)
		...

输出结果:

复制代码
{'epoch': -1, 'best_fitness': None,...}

说明训练好后,ckpt["epoch"]会变成-1,然而我找了一下午也没找到入口在哪里,**知道的同学可以告诉我一下吗?谢谢。**解释一下,这里的ckpt是存储在权重文件,也就是xxx.pt中的一个字典。

2.另外,打印save_dir的路径:

python 复制代码
def __init__(self, cfg=DEFAULT_CFG, overrides=None, _callbacks=None):

        self.args = get_cfg(cfg, overrides)
        self.resume_epochs = self.args.epochs
        self.check_resume(overrides)
        print(self.args.save_dir)

发现结果是报错,而这个参数在未训练完成时,是"runs/detect/train"。对比情况如下:

这说明训练完后,这个save_dir参数被自动删掉了,而这个参数是指引上一次训练结果输出的位置的。所以,这个参数被删掉也会使得resume时不会读上一次训练的目录,而是新创一个。被删除的原因应该和1一样,是在训练完成后自动被处理的。我也没找到具体代码,但我觉得可能在callback函数里,知道的大佬可以告诉我一下吗?

综上,我们要做的就是把save_dir和ckpt[epoch]这两个参数手动恢复。

二、修改方法

注意添加的代码位置,最好跟我位置一样。

步骤1.在trainer.py的__init__() 构造函数里,先用一个变量接收config的epochs

python 复制代码
    def __init__(self, cfg=DEFAULT_CFG, overrides=None, _callbacks=None):
        """
        Initializes the BaseTrainer class.

        Args:
            cfg (str, optional): Path to a configuration file. Defaults to DEFAULT_CFG.
            overrides (dict, optional): Configuration overrides. Defaults to None.
        """
        self.args = get_cfg(cfg, overrides)
        ################修改处################
        self.resume_epochs = self.args.epochs# 添加变量接收config,即你规定的epochs
        ######################################
        self.check_resume(overrides)
		...
		...
		...

步骤2. 在check_resume里,添加上一次训练的输出位置,并且恢复self.epochs

python 复制代码
    def check_resume(self, overrides):
        """Check if resume checkpoint exists and update arguments accordingly."""
        resume = self.args.resume
        if resume:
            try:
                ...
                ckpt_args = attempt_load_weights(last).args
                #####################修改处↓#####################
                ckpt_args["save_dir"] = "runs\\detect\\train"# <--- 修改处
                #####################修改处↑####################
                ...
				self.args = get_cfg(ckpt_args)
                ############修改处#####################
                self.args.epochs = self.resume_epochs #重新覆盖self.args.epochs数值 
                #######################################
                self.args.model = str(last)  # reinstate model
            	...
            	...

步骤3. 手动添加上次训练好的模型的终止epoch数-1。比如上次我训练了120轮,结束了,我这里就要写120-1=119。一定要-1哈。 因为我们是手动添加的epoch,所以要注意,这个数加进去之后,我们要多注意,我详细说下:刚才不是说了吗,如果在训练过程中,这个epoch是正常的,所以我们手动设置了ckpt["epoch"]后,训练过程中,它是会正常变化的。但训练完后,还会变成-1,如果像继续训练,则要继续改。这里要一直注意到这个参数,会比较动态。比如我们从训练完的120轮再追加30轮,训练到150轮后,epoch又变成-1,如果我们再想追加10轮,那么这里要改成150-1=149,然后继续训练。

python 复制代码
    def resume_training(self, ckpt):
        """Resume YOLO training from given epoch and best fitness."""
        if ckpt is None:
            return
        best_fitness = 0.0
        ###############################
        if ckpt["epoch"] == -1:  #修改处
        	ckpt["epoch"] = 119 # 修改处
        ################################
        start_epoch = ckpt["epoch"] + 1
        ...

步骤4. 修改你的启动训练参数,比如,120 -> 150

python 复制代码
from ultralytics import YOLO
if __name__ == '__main__':

    model = YOLO("runs\\detect\\train\\weights\\last.pt")
    results = model.train(data="C:\\Users\\Administrator\\Desktop\\ultralytics-main\\ultralytics-main\\ultralytics\\datasets\\mask\\data.yaml", epochs=150, batch=4, workers=2, resume=True, device=0)

结束,效果如下,我从训练完的120轮有追加了1轮。

相关推荐
向哆哆5 天前
高精度织物缺陷检测数据集(适用YOLO系列/1000+标注)(已标注+划分/可直接训练)
yolo·目标检测
前网易架构师-高司机6 天前
带标注的驾驶员安全带识别数据集,识别率99.5%,可识别有无系安全带,支持yolo,coco json,pascal voc xml格式
xml·yolo·数据集·交通·安全带
向哆哆6 天前
粉尘环境分类检测千张图数据集(适用YOLO系列)(已标注+划分/可直接训练)
yolo·分类·数据挖掘
琅琊榜首20206 天前
移动端AI挂机新范式:YOLOv8+NCNN实现无Root视觉自动化
人工智能·yolo·自动化
智驱力人工智能7 天前
地铁隧道轨道障碍物实时检测方案 守护城市地下动脉的工程实践 轨道障碍物检测 高铁站区轨道障碍物AI预警 铁路轨道异物识别系统价格
人工智能·算法·yolo·目标检测·计算机视觉·边缘计算
智驱力人工智能7 天前
机场鸟类活动智能监测 守护航空安全的精准工程实践 飞鸟检测 机场鸟击预防AI预警系统方案 机场停机坪鸟类干扰实时监测机场航站楼鸟击预警
人工智能·opencv·算法·安全·yolo·目标检测·边缘计算
前端摸鱼匠7 天前
YOLOv8使用 Ultralytics 内置功能简化格式转换:介绍如何使用 yolo mode=data 等相关功能或辅助工具来加速和简化数据格式的准备工作
人工智能·yolo·目标检测·机器学习·目标跟踪·视觉检测
hans汉斯7 天前
《数据挖掘》期刊推介&征稿指南
图像处理·人工智能·算法·yolo·数据挖掘·超分辨率重建·汉斯出版社
卓越软件开发7 天前
毕设全栈开发一条龙:Java/SpringBoot/Vue/ 小程序 / Python / 安卓 / AI 图像识别 人脸检测 车牌识别 YOLO
开发语言·spring boot·python·yolo·小程序·毕业设计·课程设计
向哆哆7 天前
单车/共享单车目标检测数据集(适用YOLO系列)(已标注+划分/可直接训练)
人工智能·yolo·目标检测