【Pytorch 第三讲】如何使用pre-trained weights 来训练自己的模型

理由#

有时在训练自己的模型时,如果从头开始训练自己的模型, 不但费时费力, 有时可能训练了很久, 好不容易收敛, 发现结果不是太好。 如果能够基于被人 已经训练好的权重, 初始化自己的模型。那么在训练自己的模型时会事半功倍。

一. Check Pre-trained Weights

python 复制代码
import torch
from icecream import ic
ckpt=torch.load("/home/ggl/full_skip.pth")
ic(ckpt.keys())

Output:

ic| ckpt.keys(): odict_keys(['patch_embed.conv_down.0.weight', 'patch_embed.conv_down.1.weight', ..........................................

python 复制代码
import torch
from icecream import ic
tar_ckpt=torch.load("/home/ggl/Downloads/224_1k.pth.tar")
ic(tar_ckpt.keys())

Output: ic| tar_ckpt.keys(): dict_keys(['epoch', 'arch', 'state_dict', 'optimizer', 'version', 'args', 'amp_scaler', 'metric'])

根据上面的输出,可以看到, 保存的权重中的键值对是不一样的。

第一个,保存的直接是 'state_dict"

第二个,保存的信息更加全面。 tar_ckpt["state_dict"] ,相当于第一个。

--------------------------------------------------- 补充信息 -------------------------------------------------------

补充信息:

dictOrderedDictodict)都是 Python 中的字典数据结构,但它们在维护元素顺序上有所不同。

1. dict(字典):

示例:

python 复制代码
my_dict = {'a': 1, 'b': 2, 'c': 3} 
for key, value in my_dict.items(): 
    print(key, value) 
  • 在 Python 3.7 之前,字典并不保持元素的插入顺序。即,当你迭代一个字典时,元素的顺序不一定与添加它们的顺序相同。
  • 从 Python 3.7 开始,字典开始维护元素的插入顺序。但是,这是在 CPython 的具体实现上,并不是 Python 语言规范的一部分。

在 Python 3.7 及之后的版本中,以上代码输出的顺序将是 'a', 'b', 'c'

2. OrderedDict(有序字典):

示例:

python 复制代码
from collections import OrderedDict 
my_ordered_dict = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) 
for key, value in my_ordered_dict.items(): 
    print(key, value)

输出的顺序将始终是 'a', 'b', 'c'。

python

  • OrderedDictcollections 模块中的一个类,它从 Python 2.7 开始引入,并在 Python 3 中得到了延续。
  • OrderedDict 会维护元素的插入顺序,因此当你迭代它时,元素的顺序是按照它们被插入的顺序。
  • OrderedDict 的一个重要特性是,当你比较两个 OrderedDict 时,它们的元素顺序也需要相同。

总的来说,如果你需要在迭代时保持元素顺序,可以使用 OrderedDict。如果你使用的是 Python 3.7 及更高版本的话,普通的字典也会保持插入顺序。

二. Check self-model weights Or self-weights

三. Transfer pre-trained Weights to self-weights

Note: 正在完成中....稍后待续

相关推荐
数据分析螺丝钉20 分钟前
力扣第240题“搜索二维矩阵 II”
经验分享·python·算法·leetcode·面试
sp_fyf_202434 分钟前
[大语言模型-论文精读] 更大且更可指导的语言模型变得不那么可靠
人工智能·深度学习·神经网络·搜索引擎·语言模型·自然语言处理
小蜗笔记1 小时前
在Python中实现多目标优化问题(7)模拟退火算法的调用
开发语言·python·模拟退火算法
TANGLONG2221 小时前
【C语言】数据在内存中的存储(万字解析)
java·c语言·c++·python·考研·面试·蓝桥杯
肖遥Janic1 小时前
Stable Diffusion绘画 | 插件-Deforum:商业LOGO广告视频
人工智能·ai·ai作画·stable diffusion
魏大橙1 小时前
Fastjson反序列化
开发语言·python
立黄昏粥可温2 小时前
Python 从入门到实战34(实例2:绘制蟒蛇)
开发语言·python
柚乐果果2 小时前
数据分析实战简例
java·大数据·python
luthane2 小时前
python 实现djb2哈希算法
python·算法·哈希算法
yz_518 Nemo2 小时前
django的路由分发
后端·python·django