【Pytorch 第三讲】如何使用pre-trained weights 来训练自己的模型

理由#

有时在训练自己的模型时,如果从头开始训练自己的模型, 不但费时费力, 有时可能训练了很久, 好不容易收敛, 发现结果不是太好。 如果能够基于被人 已经训练好的权重, 初始化自己的模型。那么在训练自己的模型时会事半功倍。

一. Check Pre-trained Weights

python 复制代码
import torch
from icecream import ic
ckpt=torch.load("/home/ggl/full_skip.pth")
ic(ckpt.keys())

Output:

ic| ckpt.keys(): odict_keys(['patch_embed.conv_down.0.weight', 'patch_embed.conv_down.1.weight', ..........................................

python 复制代码
import torch
from icecream import ic
tar_ckpt=torch.load("/home/ggl/Downloads/224_1k.pth.tar")
ic(tar_ckpt.keys())

Output: ic| tar_ckpt.keys(): dict_keys(['epoch', 'arch', 'state_dict', 'optimizer', 'version', 'args', 'amp_scaler', 'metric'])

根据上面的输出,可以看到, 保存的权重中的键值对是不一样的。

第一个,保存的直接是 'state_dict"

第二个,保存的信息更加全面。 tar_ckpt["state_dict"] ,相当于第一个。

--------------------------------------------------- 补充信息 -------------------------------------------------------

补充信息:

dictOrderedDictodict)都是 Python 中的字典数据结构,但它们在维护元素顺序上有所不同。

1. dict(字典):

示例:

python 复制代码
my_dict = {'a': 1, 'b': 2, 'c': 3} 
for key, value in my_dict.items(): 
    print(key, value) 
  • 在 Python 3.7 之前,字典并不保持元素的插入顺序。即,当你迭代一个字典时,元素的顺序不一定与添加它们的顺序相同。
  • 从 Python 3.7 开始,字典开始维护元素的插入顺序。但是,这是在 CPython 的具体实现上,并不是 Python 语言规范的一部分。

在 Python 3.7 及之后的版本中,以上代码输出的顺序将是 'a', 'b', 'c'

2. OrderedDict(有序字典):

示例:

python 复制代码
from collections import OrderedDict 
my_ordered_dict = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) 
for key, value in my_ordered_dict.items(): 
    print(key, value)

输出的顺序将始终是 'a', 'b', 'c'。

python

  • OrderedDictcollections 模块中的一个类,它从 Python 2.7 开始引入,并在 Python 3 中得到了延续。
  • OrderedDict 会维护元素的插入顺序,因此当你迭代它时,元素的顺序是按照它们被插入的顺序。
  • OrderedDict 的一个重要特性是,当你比较两个 OrderedDict 时,它们的元素顺序也需要相同。

总的来说,如果你需要在迭代时保持元素顺序,可以使用 OrderedDict。如果你使用的是 Python 3.7 及更高版本的话,普通的字典也会保持插入顺序。

二. Check self-model weights Or self-weights

三. Transfer pre-trained Weights to self-weights

Note: 正在完成中....稍后待续

相关推荐
岁月宁静2 分钟前
图像生成接口的工程化设计与落地实践:封装豆包图像生成模型 Seedream 4.0 API
前端·人工智能·node.js
风雨同舟的代码笔记17 分钟前
5.Python函数与模块化工程实战:构建高复用代码体系
python
万岳科技程序员小金24 分钟前
多商户商城APP源码开发的未来方向:云原生、电商中台与智能客服
人工智能·云原生·开源·软件开发·app开发·多商户商城系统源码·多商户商城app开发
蓝色 - Lanse24 分钟前
模型推理如何利用非前缀缓存
人工智能·缓存
CoookeCola27 分钟前
MovieNet (paper) :推动电影理解研究的综合数据集与基准
数据库·论文阅读·人工智能·计算机视觉·视觉检测·database
我的xiaodoujiao29 分钟前
使用 Python 语言 从 0 到 1 搭建完整 Web UI自动化测试学习系列 22--数据驱动--参数化处理 Json 文件
python·学习·测试工具·pytest
别慌,让我先缓缓33 分钟前
PyModbus 从入门到精通教程
python
火星资讯41 分钟前
多形态机器人协同发力优艾智合引领核电运维智能化升级
人工智能
景彡先生42 分钟前
Python Flask详解:从入门到实战,轻量级Web框架的魅力
前端·python·flask
qq_4203620343 分钟前
AI在前端工作中的应用
前端·人工智能·sse