torch lighting 保存最优模型和最后模型

python 复制代码
early_stop_callback = EarlyStopping(monitor="val/body_pix", mode="min", patience=args.early_stop)

ckpt_callback = ModelCheckpoint(
    monitor='val/body_pix',
    save_top_k=1,
    mode='min',
    dirpath=args.save_path,
    # filename='body_pixel-epoch={epoch}-val_body_pix={val/body_pix:.4f}',
    filename='best-{}'.format(args.save_name),
    auto_insert_metric_name=False
)

last_callback = ModelCheckpoint(
    every_n_epochs=args.max_epochs,
    save_top_k=1,
    dirpath=args.save_path,
    # filename='body_pixel-epoch={epoch}-val_body_pix={val/body_pix:.4f}',
    filename='last-{}'.format(args.save_name),
    auto_insert_metric_name=False
)

trainer = pl.Trainer(
    accelerator=accelerator, devices=args.devices,
    strategy=strategy,
    # sync_batchnorm=True,
    default_root_dir=args.default_log_path,
    # gradient_clip_val=args.gradient_clip_val,
    precision="bf16-mixed",
    max_epochs=args.max_epochs,
    callbacks=[early_stop_callback, ckpt_callback, last_callback]
)

ref:https://lightning.ai/docs/pytorch/stable/api/lightning.pytorch.callbacks.ModelCheckpoint.html#lightning.pytorch.callbacks.ModelCheckpoint

相关推荐
艾派森3 分钟前
深度学习实战-基于EfficientNetB5的家禽鸡病图像分类识别模型
人工智能·python·深度学习·神经网络·分类
码农的神经元25 分钟前
从论文复现到模型升级:Transformer-Attention-WOA-XGBoost 在含新能源配电网故障诊断中的实现
人工智能·深度学习·transformer
EnCi Zheng25 分钟前
04-缩放点积注意力代码实现 [特殊字符]
人工智能·pytorch·python
2zcode1 小时前
基于注意力机制LSTM的温度预测系统设计与实现
人工智能·深度学习·lstm
庞轩px1 小时前
Transformer的核心思想——Attention机制直观理解
人工智能·rnn·深度学习·transformer·attention·q-k-v
β添砖java2 小时前
深度学习(16)卷积层里的填充和步幅
人工智能·深度学习
FL162386312913 小时前
电力设备红外图像与可见光图像配准数据集227对共454张无标注
深度学习
LaughingZhu15 小时前
Product Hunt 每日热榜 | 2026-04-27
人工智能·经验分享·深度学习·产品运营
LaughingZhu15 小时前
Product Hunt 每日热榜 | 2026-04-26
人工智能·经验分享·深度学习·百度·产品运营
DogDaoDao16 小时前
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病
人工智能·深度学习·程序员·大模型·github·ai编程·andrej-karpathy