pytorch——神经网络框架的搭建以及网络的训练

文章目录

一、网络骨架的搭建(Containers)

二、网络模型的下载和运用到自己数据集

weights为false时候,都是默认的参数

若为true,则为模型在它的数据集上面的训练的参数

三、网络模型的保存与获取

保存

第二种方式是以字典显示

获取

第二种,直接显示的话,则为字典显示,需要转换一下,才能显示模型。

四、模型训练套路

他人博主训练套路链接

五、利用GPU训练

加快模型训练速度,本质上是并行计算

方式一

在下面基础位置加上cuda即可。

如下:

方式二

在device括号里面设置要运行的设备;也可改为cuda(GPU上面跑)



注意

六、完整的模型验证

(测试,demo)套路-利用已经训练好的模型,然后给它提供输入

如果将训练好的网络模型,放到test上面

test.py书写;

python 复制代码
import torch
import torchvision
from PIL import Image
from torch import nn
from torchvision import transforms

image_path="E:\PythonProject\image\dog.png"
image=Image.open(image_path)
#将图片大小转为32*32以适应网络数据输入格式   并且将图片转为三通道图像
image=image.convert("RGB")
transform=torchvision.transforms.Compose([
    torchvision.transforms.Resize((32,32)),
    torchvision.transforms.ToTensor()  ])

image=transform(image)

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64 * 4 * 4, 64),
            nn.Linear(64, 10)
        )

    def forward(self, x):
            x = self.model(x)
            return x


#模型的加载
model=torch.load("net_5_cpu.pth",weights_only=False)
image=torch.reshape(image,(1,3,32,32))
model.eval()

with torch.no_grad():
    output=model(image)

print(output)
print(output.argmax(1))

注意

如果训练的模型为gpu训练的

则要映射到cpu下面

七、怎么样看别人的代码

1、找到train.py

看里面的结构

2、参数的设置


设置完参数,直接运行即可

相关推荐
道可云3 小时前
5A景区智慧导览服务:从评审标准到技术实践——解析“道可云”智能导览系统如何以“VR+轻量化”重塑文旅体验
人工智能·旅游
科技大视界3 小时前
2026年6月AI电商智能体推荐指南:AI电商视频生成、卖点提取
人工智能
米小虾4 小时前
Loop Engineering 深度实践指南:9 种 2026 年最新做法与完整代码
人工智能·agent
aaaa954726654 小时前
从Claude Code到平替:我的vibe coding迭代体验
人工智能
叫我:松哥4 小时前
基于机器学习的中文文本抑郁症风险检测系统,包括NLP与传统机器学习的抑郁症识别,准确率92%
人工智能·深度学习·机器学习·自然语言处理·flask·nlp·bootstrap
天天讯通4 小时前
OKCC 呼叫中心安全性能全解析:技术防护与管理措施指南
大数据·开发语言·网络·人工智能·安全·语音识别
hai3152475434 小时前
九章编程法 · 猜数字游戏 (GW-BASIC 重构版) *
人工智能·microsoft·游戏引擎·游戏程序
邵宇然4 小时前
跨沙箱动态传递:WASM 与宿主环境间变长文本数据的零拷贝读取
人工智能
小小小花儿4 小时前
如何使用Codex进行Vibe Coding
人工智能
信也科技布道师4 小时前
Agent Skills + Vibe Testing:构建人机协作的测试闭环
人工智能·agent skills