Pytorch Lightning 框架运行顺序

之前学习Lightning在打断点debug的时候一直不懂为什么trainer.fit()之后就开始运行了 其中的hooks 什么的概念也不理解 在看了若干文章后大致理解其中顺序。如有错误请斧正。
Hooks: 实际就是lighting框架的运行顺序, train阶段的运行顺序大致如下(其中的函数都可以重写):

python 复制代码
def fit(self):
    configure_callbacks()

    if local_rank == 0:
        prepare_data()

    setup("fit")
    configure_model()
    configure_optimizers()

    on_fit_start()

    # the sanity check runs here

    on_train_start()
    for epoch in epochs:
        fit_loop()
    on_train_end()

    on_fit_end()
    teardown("fit")

需要注意的是:

  1. the sanity check runs here 这行注释 lighting会先执行validation_step() 跑两个batch 进行检查。(之前一直不懂为什么train的时候先执行validation)
  2. prepare_data() 和 setup() 这两个function 在Data的class里重写 其余的在model的class里重写。
相关推荐
同元软控21 小时前
建模也有Skills了:MWORKS.Sysplorer Skills已开源至MoHub!
人工智能·开源·mworks
SKY -dada21 小时前
02--光伏电站的“隐形杀手”——直流拉弧:AI智能识别如何构筑安全防线?
人工智能·安全
凌波粒21 小时前
深度学习入门(鱼书)第1章笔记——Python 基础
笔记·python·深度学习
Deepoch21 小时前
Deepoc 具身智能开发板,让农业机器人更聪明好用
人工智能·机器人·具身模型·deepoc·采摘
1368木林森1 天前
多轮对话RAG【第十五篇】:工业级上下文管理方案,指代消除、会话隔离、动态检索伸缩
人工智能·rag
bryant_meng1 天前
【GAN】Generative Adversarial Network
人工智能·深度学习·神经网络·生成对抗网络·gan
一条泥憨鱼1 天前
全面解析 AI 大模型中的 Prompt
人工智能·ai·prompt
WL_Aurora1 天前
Python 算法基础篇之查找算法(三):树表查找
python·算法
BFT白芙堂1 天前
【买机器人,上BFT】基于 LoHo-Manip 框架的 Franka Research3 机械臂长程操作研究
人工智能·学习·机器人·研究·具身智能·franka·loho-manip 框架
阿乔外贸日记1 天前
霍尔木兹通行规则调整,影响卡塔尔LNG出口恢复
大数据·人工智能·云计算