【Pytorch 第三讲】如何使用pre-trained weights 来训练自己的模型

理由#

有时在训练自己的模型时,如果从头开始训练自己的模型, 不但费时费力, 有时可能训练了很久, 好不容易收敛, 发现结果不是太好。 如果能够基于被人 已经训练好的权重, 初始化自己的模型。那么在训练自己的模型时会事半功倍。

一. Check Pre-trained Weights

python 复制代码
import torch
from icecream import ic
ckpt=torch.load("/home/ggl/full_skip.pth")
ic(ckpt.keys())

Output:

ic| ckpt.keys(): odict_keys(['patch_embed.conv_down.0.weight', 'patch_embed.conv_down.1.weight', ..........................................

python 复制代码
import torch
from icecream import ic
tar_ckpt=torch.load("/home/ggl/Downloads/224_1k.pth.tar")
ic(tar_ckpt.keys())

Output: ic| tar_ckpt.keys(): dict_keys(['epoch', 'arch', 'state_dict', 'optimizer', 'version', 'args', 'amp_scaler', 'metric'])

根据上面的输出,可以看到, 保存的权重中的键值对是不一样的。

第一个,保存的直接是 'state_dict"

第二个,保存的信息更加全面。 tar_ckpt["state_dict"] ,相当于第一个。

--------------------------------------------------- 补充信息 -------------------------------------------------------

补充信息:

dictOrderedDictodict)都是 Python 中的字典数据结构,但它们在维护元素顺序上有所不同。

1. dict(字典):

示例:

python 复制代码
my_dict = {'a': 1, 'b': 2, 'c': 3} 
for key, value in my_dict.items(): 
    print(key, value) 
  • 在 Python 3.7 之前,字典并不保持元素的插入顺序。即,当你迭代一个字典时,元素的顺序不一定与添加它们的顺序相同。
  • 从 Python 3.7 开始,字典开始维护元素的插入顺序。但是,这是在 CPython 的具体实现上,并不是 Python 语言规范的一部分。

在 Python 3.7 及之后的版本中,以上代码输出的顺序将是 'a', 'b', 'c'

2. OrderedDict(有序字典):

示例:

python 复制代码
from collections import OrderedDict 
my_ordered_dict = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) 
for key, value in my_ordered_dict.items(): 
    print(key, value)

输出的顺序将始终是 'a', 'b', 'c'。

python

  • OrderedDictcollections 模块中的一个类,它从 Python 2.7 开始引入,并在 Python 3 中得到了延续。
  • OrderedDict 会维护元素的插入顺序,因此当你迭代它时,元素的顺序是按照它们被插入的顺序。
  • OrderedDict 的一个重要特性是,当你比较两个 OrderedDict 时,它们的元素顺序也需要相同。

总的来说,如果你需要在迭代时保持元素顺序,可以使用 OrderedDict。如果你使用的是 Python 3.7 及更高版本的话,普通的字典也会保持插入顺序。

二. Check self-model weights Or self-weights

三. Transfer pre-trained Weights to self-weights

Note: 正在完成中....稍后待续

相关推荐
执笔论英雄1 分钟前
【LORA】
人工智能
Jerryhut14 分钟前
Bev感知特征空间算法
人工智能
xian_wwq24 分钟前
【学习笔记】基于人工智能的火电机组全局性能一体化优化研究
人工智能·笔记·学习·火电
B站计算机毕业设计之家28 分钟前
基于大数据热门旅游景点数据分析可视化平台 数据大屏 Flask框架 Echarts可视化大屏
大数据·爬虫·python·机器学习·数据分析·spark·旅游
春风LiuK37 分钟前
虚实无界:VRAR如何重塑课堂与突破研究边界
人工智能·程序人生
周纠纠1 小时前
附录1:中文切词
python
Cricyta Sevina1 小时前
Java Collection 集合进阶知识笔记
java·笔记·python·collection集合
歌_顿1 小时前
Embedding 模型word2vec/glove/fasttext/elmo/doc2vec/infersent学习总结
人工智能·算法
胡萝卜3.01 小时前
深入C++可调用对象:从function包装到bind参数适配的技术实现
开发语言·c++·人工智能·机器学习·bind·function·包装器