YOLO resume断点续训(不能用官方的权重,是自己训练一半生成的last.pt)

训练 YOLO 模型(v5/v8/v11)常需数百 epoch,耗时数天。断电、SSH 断开、显存溢出、进程误杀等意外极易导致训练中断,从头开始会浪费大量算力与时间。

断点续训(Resume Training)可从最近保存的检查点(checkpoint) 恢复训练,完整还原模型权重、优化器状态、学习率调度与训练进度

训练中断后,在对应的runs中对应训练的结果中包含两个关键文件:

  • last.pt:最新epoch的完整训练快照(用于续训)
  • best.pt :验证集最优权重(仅用于推理,不可直接续训

last.pt 绝非仅模型权重,而是全训练状态快照

  • 模型网络参数(权重 + 偏置)
  • 优化器状态(SGD/Adam 动量、梯度缓存)
  • 学习率调度器状态(当前步数、余弦退火参数)
  • 当前 epoch 计数与剩余轮数
  • 数据加载器随机种子(保证数据增强一致性)

成功续训日志会显示:

from epoch 217:接续中断前轮数,成功

from epoch 0:用了 best.pt 或路径错误,从头训练

必守前提(否则续训失败)

配置完全一致:data.yaml(类别数)、模型 yaml(网络结构)、batch size、device、超参(lr0、momentum)不可修改

last.pt 完整 :文件未损坏、路径正确、由同一代码版本生成

不混用 best.ptbest.pt 不含优化器状态,只能用于推理

在对应的.yaml文件中,只需要将resume修改为True,然后训练导入的预训练权重用训练一半的last.pt

复制代码
from ultralytics import YOLO

# 加载预训练模型
model = YOLO("./runs/detect/exp2/last.pt")  # n/s/m/l/x 任选

# 开始训练
model.train(
    data="your_data.yaml",    # 你的数据集配置 .\ultralytics\cfg\***.yaml
)
相关推荐
AI医影跨模态组学2 小时前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
温九味闻醉3 小时前
关于腾讯广告算法大赛2025项目分析3-重读
人工智能·机器学习
啦啦啦_99995 小时前
0. 深度学习课程大纲:
深度学习
AI医影跨模态组学6 小时前
Cancer Letters(IF=10.1)中山大学附属第六医院等团队:基于治疗前MRI影像的RCMIX模型预测MRI定义的cT4期直肠癌T分期下降
人工智能·机器学习·论文·医学·医学影像·影像组学
染指11108 小时前
3.AI大模型-token是什么-大模型底层运行机制
人工智能·算法·机器学习
stsdddd8 小时前
【YOLO算法多类别野生动物识别目标检测数据集】
人工智能·yolo·目标检测
南宫萧幕9 小时前
基于 Simulink 与 Python 联合仿真的 eVTOL 强化学习全链路实战
开发语言·人工智能·python·算法·机器学习·控制
哥布林学者9 小时前
深度学习进阶(二十二)T5:NLP任务的首次大一统
机器学习·ai
张二娃同学9 小时前
第08篇_RNN_LSTM_GRU序列模型
人工智能·python·rnn·深度学习·神经网络·gru·lstm