torch lighting 保存最优模型和最后模型

python 复制代码
early_stop_callback = EarlyStopping(monitor="val/body_pix", mode="min", patience=args.early_stop)

ckpt_callback = ModelCheckpoint(
    monitor='val/body_pix',
    save_top_k=1,
    mode='min',
    dirpath=args.save_path,
    # filename='body_pixel-epoch={epoch}-val_body_pix={val/body_pix:.4f}',
    filename='best-{}'.format(args.save_name),
    auto_insert_metric_name=False
)

last_callback = ModelCheckpoint(
    every_n_epochs=args.max_epochs,
    save_top_k=1,
    dirpath=args.save_path,
    # filename='body_pixel-epoch={epoch}-val_body_pix={val/body_pix:.4f}',
    filename='last-{}'.format(args.save_name),
    auto_insert_metric_name=False
)

trainer = pl.Trainer(
    accelerator=accelerator, devices=args.devices,
    strategy=strategy,
    # sync_batchnorm=True,
    default_root_dir=args.default_log_path,
    # gradient_clip_val=args.gradient_clip_val,
    precision="bf16-mixed",
    max_epochs=args.max_epochs,
    callbacks=[early_stop_callback, ckpt_callback, last_callback]
)

ref:https://lightning.ai/docs/pytorch/stable/api/lightning.pytorch.callbacks.ModelCheckpoint.html#lightning.pytorch.callbacks.ModelCheckpoint

相关推荐
xier_ran3 小时前
深度学习:生成对抗网络(GAN)详解
人工智能·深度学习·机器学习·gan
海边夕阳20063 小时前
【每天一个AI小知识】:什么是循环神经网络?
人工智能·经验分享·rnn·深度学习·神经网络·机器学习
【建模先锋】4 小时前
论文复现!基于SAM-BiGRU网络的锂电池RUL预测
深度学习·论文复现·锂电池寿命预测·锂电池数据集·寿命预测
清云逸仙6 小时前
AI Prompt 工程最佳实践:打造结构化的Prompt
人工智能·经验分享·深度学习·ai·ai编程
松岛雾奈.2307 小时前
深度学习--TensorFlow框架使用
深度学习·tensorflow·neo4j
中杯可乐多加冰8 小时前
逻辑控制案例详解|基于smardaten实现OA一体化办公系统逻辑交互
人工智能·深度学习·低代码·oa办公·无代码·一体化平台·逻辑控制
大佬,救命!!!8 小时前
更换适配python版本直接进行机器学习深度学习等相关环境配置(非仿真环境)
人工智能·python·深度学习·机器学习·学习笔记·详细配置
励志成为糕手9 小时前
循环神经网络(RNN):时序数据的深度学习模型
人工智能·rnn·深度学习·gru·lstm
CoovallyAIHub11 小时前
超越YOLOv8/v11!自研RKM-YOLO为输电线路巡检精度、速度双提升
深度学习·算法·计算机视觉
BagMM12 小时前
FC-CLIP 论文阅读 开放词汇的检测与分割的统一
人工智能·深度学习·计算机视觉