【Pytorch 第三讲】如何使用pre-trained weights 来训练自己的模型

理由#

有时在训练自己的模型时,如果从头开始训练自己的模型, 不但费时费力, 有时可能训练了很久, 好不容易收敛, 发现结果不是太好。 如果能够基于被人 已经训练好的权重, 初始化自己的模型。那么在训练自己的模型时会事半功倍。

一. Check Pre-trained Weights

python 复制代码
import torch
from icecream import ic
ckpt=torch.load("/home/ggl/full_skip.pth")
ic(ckpt.keys())

Output:

ic| ckpt.keys(): odict_keys(['patch_embed.conv_down.0.weight', 'patch_embed.conv_down.1.weight', ..........................................

python 复制代码
import torch
from icecream import ic
tar_ckpt=torch.load("/home/ggl/Downloads/224_1k.pth.tar")
ic(tar_ckpt.keys())

Output: ic| tar_ckpt.keys(): dict_keys('epoch', 'arch', 'state_dict', 'optimizer', 'version', 'args', 'amp_scaler', 'metric')

根据上面的输出,可以看到, 保存的权重中的键值对是不一样的。

第一个,保存的直接是 'state_dict"

第二个,保存的信息更加全面。 tar_ckpt"state_dict" ,相当于第一个。

--------------------------------------------------- 补充信息 -------------------------------------------------------

补充信息:

dictOrderedDictodict)都是 Python 中的字典数据结构,但它们在维护元素顺序上有所不同。

1. dict(字典):

示例:

python 复制代码
my_dict = {'a': 1, 'b': 2, 'c': 3} 
for key, value in my_dict.items(): 
    print(key, value) 
  • 在 Python 3.7 之前,字典并不保持元素的插入顺序。即,当你迭代一个字典时,元素的顺序不一定与添加它们的顺序相同。
  • 从 Python 3.7 开始,字典开始维护元素的插入顺序。但是,这是在 CPython 的具体实现上,并不是 Python 语言规范的一部分。

在 Python 3.7 及之后的版本中,以上代码输出的顺序将是 'a', 'b', 'c'

2. OrderedDict(有序字典):

示例:

python 复制代码
from collections import OrderedDict 
my_ordered_dict = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) 
for key, value in my_ordered_dict.items(): 
    print(key, value)

输出的顺序将始终是 'a', 'b', 'c'。

python

  • OrderedDictcollections 模块中的一个类,它从 Python 2.7 开始引入,并在 Python 3 中得到了延续。
  • OrderedDict 会维护元素的插入顺序,因此当你迭代它时,元素的顺序是按照它们被插入的顺序。
  • OrderedDict 的一个重要特性是,当你比较两个 OrderedDict 时,它们的元素顺序也需要相同。

总的来说,如果你需要在迭代时保持元素顺序,可以使用 OrderedDict。如果你使用的是 Python 3.7 及更高版本的话,普通的字典也会保持插入顺序。

二. Check self-model weights Or self-weights

三. Transfer pre-trained Weights to self-weights

Note: 正在完成中....稍后待续

相关推荐
小和尚同志3 小时前
AI 自动化测试探索(二):Chrome-devtools MCP
人工智能·e2e·aigc
花酒锄作田4 小时前
Pydantic校验配置文件
python
hboot4 小时前
AI工程师第四课 - 深度学习入门
pytorch·python·神经网络
冬奇Lab6 小时前
Workflow 系列(02):设计范式——四层架构、三种 Context 传递模式与确认门设计
人工智能·agent·工作流引擎
冬奇Lab6 小时前
每日一个开源项目(第145篇):Trellis - 把项目记忆、规范和任务上下文持久化进代码仓库
人工智能·开源·资讯
有道AI情报局6 小时前
Harness即产品
人工智能·agent
罗西的思考7 小时前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
IT_陈寒8 小时前
SpringBoot自动配置的坑,我的API突然就404了
前端·人工智能·后端
笃行3508 小时前
从零到上线:用 EdgeOne Makers + CodeBuddy 搭一个「对账核对员」AI Agent
人工智能
用户6856326208699 小时前
Claude Code 乱猜字段名?我给它写了一个"数据库查询约束 Skill"
人工智能