PyTorch入门学习(十五):现有网络模型的使用及修改

目录

一、使用现有网络模型

二、修改现有网络模型


一、使用现有网络模型

PyTorch提供了许多流行的深度学习模型,这些模型在大规模图像数据集上进行了预训练。其中一个著名的模型是VGG16。下面是如何使用VGG16模型的示例代码:

python 复制代码
import torchvision
from torch import nn
from torchvision.models import VGG16

# 使用不带预训练权重的VGG16模型
vgg16_false = torchvision.models.vgg16(pretrained=False)

# 使用预训练权重的VGG16模型
vgg16_true = torchvision.models.vgg16(pretrained=True)

print(vgg16_false)
print(vgg16_true)

在上述代码中,使用torchvision.models.vgg16来加载VGG16模型。通过pretrained参数,我们可以选择是否加载预训练的权重。vgg16_false代表一个不带预训练权重的VGG16模型,而vgg16_true代表一个带有预训练权重的模型。

二、修改现有网络模型

一旦加载了现有的网络模型,可以对其进行修改,以满足特定任务的需求。下面是如何修改VGG16模型的示例代码:

python 复制代码
import torchvision
from torch import nn
from torchvision.models import VGG16

# 加载带有预训练权重的VGG16模型
vgg16 = torchvision.models.vgg16(pretrained=True)

# 添加一个新的线性层,将输出从1000类修改为10类
vgg16.classifier.add_module('add_linear', nn.Linear(1000, 10))

# 修改VGG16模型的最后一个全连接层
vgg16.classifier[6] = nn.Linear(4096, 10)

print(vgg16)

在上述代码中,加载了一个带有预训练权重的VGG16模型,并通过add_module方法添加了一个新的线性层,将输出从1000类修改为10类。此外,还演示了如何通过修改模型的索引来改变VGG16模型的最后一个全连接层。

这种方法可以帮助您快速构建适用于特定任务的模型,而无需从头开始训练整个网络。

完整代码如下:

python 复制代码
import torchvision
from torch import nn
from torchvision.models import VGG16_Weights

# train_data = torchvision.datasets.ImageNet("D:\\Python_Project\\pytorch\\data_image_net",split="train",download=True,transform=torchvision.transforms.ToTensor())

# 错误原因:参数pretrained自0.13起已弃用,将在0.15后删除,要改用"weights"。
vgg16_false = torchvision.models.vgg16(weights=None)
vgg16_true = torchvision.models.vgg16(weights=VGG16_Weights.DEFAULT)

# print(vgg16_true)

# 要想用于 CIFAR10 数据集, 可以在网络下面多加一行,转成10分类的输出,这样输出的结果,跟下面的不一样,位置不一样
# vgg16_true.add_module('add_Linear',nn.Linear(1000,10))
# print(vgg16_true)

vgg16_true.classifier.add_module('add_linear',nn.Linear(1000,10))
# 层级不同
# 如何利用现有的网络,改变结构
print(vgg16_true)

# 上面是添加层,下面是如何修改VGG里面的层内容
print(vgg16_false)
vgg16_false.classifier[6] = nn.Linear(4096,10)  # 中括号里的内容,是网络输出结果自带的索引,套进这种格式,就可以直接修改那一层的内容
print(vgg16_false)

参考资料:

视频教程:PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】

相关推荐
随意起个昵称16 分钟前
Dijstra算法学习笔记
笔记·学习·算法
龙山云仓18 分钟前
No155:AI中国故事-对话宋应星——天工开物与AI造物:格物穷理与经世致用
大数据·人工智能·深度学习
得一录26 分钟前
星图·微调试&全参数调试qwen3.1-B对比
人工智能·深度学习·机器学习·aigc·transformer
冰西瓜60044 分钟前
深度学习的数学原理(六)—— 梯度消失与激活函数
人工智能·深度学习
查无此人byebye44 分钟前
【超详细解读(GPU)】基于DiT的MNIST扩散模型(DDPM)完整实现
python·深度学习·nlp·transformer·多分类
袁气满满~_~1 小时前
深度学习笔记四
人工智能·笔记·深度学习
乌萨奇5371 小时前
【2025考研复试】深度学习扩展知识:从ViT到多模态,以及简历项目挖掘策略(第11章复盘)
人工智能·深度学习·考研·计算机视觉·nlp·多模态
星火开发设计1 小时前
C++ 异常处理:try-catch-throw 的基本用法
java·开发语言·jvm·c++·学习·知识·对象
七夜zippoe1 小时前
PyTorch深度革命:从自动微分到企业级应用
人工智能·pytorch·python
知识分享小能手1 小时前
SQL Server 2019入门学习教程,从入门到精通,SQL Server 2019 事务和锁 — 语法知识点及使用方法详解(13)
数据库·学习·sqlserver