PyTorch|保存与加载自己的模型

训练好一个模型之后,我们往往要对其进行保存,除非下次用时想再次训练一遍。

下面以一个简单的回归任务来详细讲解模型的保存和加载。

来看这样一组数据:

复制代码
x=torch.linspace(-1,1,50)x=x.view(50,1)y=x.pow(2)+0.3*torch.rand(50).view(50,1)

画图:

复制代码
plt.scatter(x.numpy(),y.numpy())

很显然,x与y基本呈二次函数关系 ,那么接下来我们就来拟合整个函数

复制代码
import torchimport matplotlib.pyplot as pltimport torch.nn as nnimport torch.optim as optim

x=torch.linspace(-1,1,50)x=x.view(50,1)y=x.pow(2)+0.3*torch.rand(50).view(50,1)net1=nn.Sequential(nn.Linear(1,10),                  nn.ReLU(),                  nn.Linear(10,1))criterion=nn.MSELoss()optimizer=optim.SGD(net1.parameters(),lr=0.2)#训练模型for i in range(1000):    pred=net1(x)    loss=criterion(pred,y)    optimizer.zero_grad()    loss.backward()    optimizer.step()
#测试模型net1.eval()with torch.no_grad():    y1=net1(x)    plt.plot(x.numpy(),y1.numpy(),'r-')    plt.scatter(x.numpy(),y.numpy())

结果似乎不错!

这里我们得到了一个网络net1,它可以被当作一个二次函数,用于描述之前的x,y数据的关系

得到这个网络后,我们想保存它,主要有两种方式

1,保存整个网络,包括训练后的各个层的参数

​​​​​​​

复制代码
#保存整个网络,包括训练后的各个层的参数torch.save(net1,'net1weight.pkl')

2,只保存训练好的网络的参数,速度更快

​​​​​​​

复制代码
#只保存训练好的网络的参数,速度更快torch.save(net1.state_dict(),'net1_params.pkl')

假设我们按第一种方式保存,那么下次想要使用次网络时需要这样做:

复制代码
network=torch.load('net1weight.pkl')

#测试模型network.eval()with torch.no_grad():    y1=network(x)    plt.plot(x.numpy(),y1.numpy(),'b-')    plt.scatter(x.numpy(),y.numpy())

假设我们按第二种方式保存,那么下次想要使用次网络时需要这样做:

复制代码
network=nn.Sequential(nn.Linear(1,10),                  nn.ReLU(),                  nn.Linear(10,1))network.load_state_dict(torch.load('net1_params.pkl'))​​​​​​​

#测试模型network.eval()with torch.no_grad():    y1=network(x)    plt.plot(x.numpy(),y1.numpy(),'g-')    plt.scatter(x.numpy(),y.numpy())

可以看出,第二次首先需要构造出一个一模一样的模型,接着再导入参数即可。当然,这只是个简单的回归模型,其它模型保存与加载同样如此。

总结一下:

模型保存与导入有两种方式:

方式一:​​​​​​​

复制代码
#模型保存torch.save(net1,'net1weight.pkl')#模型导入network=torch.load('net1weight.pkl')

方式二:​​​​​​​

复制代码
#模型保存torch.save(net1.state_dict(),'net1_params.pkl')#模型导入network.load_state_dict(torch.load('net1_params.pkl'))
相关推荐
才兄说3 分钟前
机器人二次开发高复杂度巡检?绕行率低于10%
人工智能·机器人
阿洛学长4 分钟前
AI编码工具重塑开发流程——GitHub Copilot实战应用与效率提升指南
人工智能·github·copilot
cczixun7 分钟前
GPT-6(Spud)全球发布:AGI 最后一公里,重新定义 AI 生产力边界
人工智能·gpt·agi
m0_743106469 分钟前
【3D硬核】四元数(Quaternions)与旋转矩阵(Rotation)——三维空间中的旋转
人工智能·计算机视觉·3d·矩阵·几何学
Where-12 分钟前
LangChain、LangGraph入门
python·langchain·langgraph
极光代码工作室14 分钟前
基于机器学习的垃圾短信识别系统
人工智能·python·深度学习·机器学习
咕噜签名-铁蛋17 分钟前
大模型Token Plan详解:选型、优化与成本控制全攻略
大数据·运维·人工智能
Coremail邮件安全17 分钟前
CACTER重磅升级|以 AI 原生重构邮件安全,开启认知防护新时代
人工智能
水上冰石18 分钟前
【智能体开发】【开发工具】【入门】7.Codex CLI入门
人工智能
key_3_feng21 分钟前
鸿蒙NEXT原生AI智能家庭助手开发方案
人工智能·华为·harmonyos