Pytorch中保存模型的两种方法

目录

一、保存整个模型

这种方法会保存模型的整个定义(包括网络结构和参数)。这样保存的模型可以直接被加载并使用,但前提是保存和加载模型的代码环境需要完全一致。

保存模型时使用代码:

python 复制代码
torch.save(model, 'model.pth')

加载模型时使用代码:

python 复制代码
model = torch.load('model.pth')

二、只保存模型参数

这种方法只会保存模型的状态字典(state_dict),即模型的参数。加载这样的模型需要先定义模型的结构,然后加载参数。

保存模型使用代码:

python 复制代码
torch.save(model.state_dict(), 'params.pth')

加载模型使用代码:

python 复制代码
model = Model()  # 需要先定义模型结构
model.load_state_dict(torch.load('params.pth'))
相关推荐
Kyrie6781 小时前
SkillOpt:把 Agent 的技能文件当作可训练参数
人工智能
冬奇Lab2 小时前
Workflow 系列(07):工程化与版本管理——Workflow 的 CI/CD
人工智能·工作流引擎
两万五千个小时2 小时前
Claude Code 上下文管理(一):为什么 Agent 会"失忆"?
人工智能·架构·开源
两万五千个小时2 小时前
Claude Code 上下文管理(二):零 Token 消耗的压缩三板斧
人工智能·程序员·开源
冬奇Lab2 小时前
每日一个开源项目(第150篇):caveman - 为什么用很多 token,少 token 也行——给 AI Agent 装上穴居人嘴巴
人工智能·开源·资讯
贵慜_Derek2 小时前
MAI-04|干净数据在工程上意味着什么:MAI 预训练数据治理
人工智能·算法·llm
feelmylife592 小时前
Agent 记忆设计架构 — 分层记忆:什么时候该记住,什么时候该忘记
人工智能
阿黎梨梨2 小时前
揭秘大语言模型的底层逻辑:从文本分词到高维向量的计算之旅
javascript·人工智能
moMo2 小时前
AI工程化 03:给模型喂上下文
人工智能