Pytorch中保存模型的两种方法

目录

一、保存整个模型

这种方法会保存模型的整个定义(包括网络结构和参数)。这样保存的模型可以直接被加载并使用,但前提是保存和加载模型的代码环境需要完全一致。

保存模型时使用代码:

python 复制代码
torch.save(model, 'model.pth')

加载模型时使用代码:

python 复制代码
model = torch.load('model.pth')

二、只保存模型参数

这种方法只会保存模型的状态字典(state_dict),即模型的参数。加载这样的模型需要先定义模型的结构,然后加载参数。

保存模型使用代码:

python 复制代码
torch.save(model.state_dict(), 'params.pth')

加载模型使用代码:

python 复制代码
model = Model()  # 需要先定义模型结构
model.load_state_dict(torch.load('params.pth'))
相关推荐
字节跳动数据库35 分钟前
文章分享——相似函数处理方法
人工智能·后端·程序员
Bigfish_coding35 分钟前
前端转agent-【python】-12 LangChain 入门实战:RAG + LCEL 链式调用
人工智能
程序员cxuan1 小时前
读懂 Claude Code 架构分析系列,第一篇,开始!
人工智能·后端·架构
ZhengEnCi1 小时前
P2L-Matplotlib饼图完全指南-从数据可视化到图表定制的Python绘图利器
python·matlab
曲幽1 小时前
你的REST接口还在“过度投喂”数据吗?——FastAPI + GraphQL实战避坑指南
python·fastapi·web·graphql·route·cors·rest·strawberry
饼干哥哥1 小时前
扣子3.0测评:我让 Codex 和 Claude Code 住同一个桌面,结果它们打架了!
人工智能·开源·代码规范
Token炼金师2 小时前
IP-Adapter:解耦交叉注意力如何让扩散模型看见图像
人工智能
Bigfish_coding2 小时前
前端转agent-【python】-11 LangGraph 高级特性:时间旅行与人工介入
人工智能
Token炼金师2 小时前
从safetensors到像素:ComfyUI Checkpoint加载机制的底层拆解
人工智能
AI闲人2 小时前
AI 写代码越来越快,为什么 Code Review 反而更慢了?
人工智能·code review·ai 编程