torch lighting 保存最优模型和最后模型

python 复制代码
early_stop_callback = EarlyStopping(monitor="val/body_pix", mode="min", patience=args.early_stop)

ckpt_callback = ModelCheckpoint(
    monitor='val/body_pix',
    save_top_k=1,
    mode='min',
    dirpath=args.save_path,
    # filename='body_pixel-epoch={epoch}-val_body_pix={val/body_pix:.4f}',
    filename='best-{}'.format(args.save_name),
    auto_insert_metric_name=False
)

last_callback = ModelCheckpoint(
    every_n_epochs=args.max_epochs,
    save_top_k=1,
    dirpath=args.save_path,
    # filename='body_pixel-epoch={epoch}-val_body_pix={val/body_pix:.4f}',
    filename='last-{}'.format(args.save_name),
    auto_insert_metric_name=False
)

trainer = pl.Trainer(
    accelerator=accelerator, devices=args.devices,
    strategy=strategy,
    # sync_batchnorm=True,
    default_root_dir=args.default_log_path,
    # gradient_clip_val=args.gradient_clip_val,
    precision="bf16-mixed",
    max_epochs=args.max_epochs,
    callbacks=[early_stop_callback, ckpt_callback, last_callback]
)

ref:https://lightning.ai/docs/pytorch/stable/api/lightning.pytorch.callbacks.ModelCheckpoint.html#lightning.pytorch.callbacks.ModelCheckpoint

相关推荐
SEU-WYL1 小时前
基于深度学习的思维控制的设备
人工智能·深度学习
唐 城4 小时前
毕业设计——医院信息化系统原型设计
人工智能·驱动开发·深度学习·数据挖掘·imagen
SEU-WYL4 小时前
基于深度学习的视频内容理解
人工智能·深度学习·音视频
唐 城5 小时前
毕业设计——物联网设备管理系统后台原型设计
人工智能·深度学习·yolo·数据挖掘·imagen
985小水博一枚呀5 小时前
【深度学习基础模型】稀疏自编码器 (Sparse Autoencoders, SAE)详细理解并附实现代码。
人工智能·python·深度学习·学习·sae·autoencoder
knighthood20015 小时前
torchvision.transforms.Resize()的用法
pytorch
好看资源平台6 小时前
深度学习在计算机视觉中的应用
人工智能·深度学习·计算机视觉
小周不摆烂6 小时前
探索深度学习的奥秘:从理论到实践的奇幻之旅
深度学习
最近好楠啊6 小时前
使用bert模型进行命名实体识别任务
人工智能·深度学习·bert
背水7 小时前
pytorch数据读入
人工智能·pytorch·python