PyTorch入门学习(十五):现有网络模型的使用及修改

目录

一、使用现有网络模型

二、修改现有网络模型


一、使用现有网络模型

PyTorch提供了许多流行的深度学习模型,这些模型在大规模图像数据集上进行了预训练。其中一个著名的模型是VGG16。下面是如何使用VGG16模型的示例代码:

python 复制代码
import torchvision
from torch import nn
from torchvision.models import VGG16

# 使用不带预训练权重的VGG16模型
vgg16_false = torchvision.models.vgg16(pretrained=False)

# 使用预训练权重的VGG16模型
vgg16_true = torchvision.models.vgg16(pretrained=True)

print(vgg16_false)
print(vgg16_true)

在上述代码中,使用torchvision.models.vgg16来加载VGG16模型。通过pretrained参数,我们可以选择是否加载预训练的权重。vgg16_false代表一个不带预训练权重的VGG16模型,而vgg16_true代表一个带有预训练权重的模型。

二、修改现有网络模型

一旦加载了现有的网络模型,可以对其进行修改,以满足特定任务的需求。下面是如何修改VGG16模型的示例代码:

python 复制代码
import torchvision
from torch import nn
from torchvision.models import VGG16

# 加载带有预训练权重的VGG16模型
vgg16 = torchvision.models.vgg16(pretrained=True)

# 添加一个新的线性层,将输出从1000类修改为10类
vgg16.classifier.add_module('add_linear', nn.Linear(1000, 10))

# 修改VGG16模型的最后一个全连接层
vgg16.classifier[6] = nn.Linear(4096, 10)

print(vgg16)

在上述代码中,加载了一个带有预训练权重的VGG16模型,并通过add_module方法添加了一个新的线性层,将输出从1000类修改为10类。此外,还演示了如何通过修改模型的索引来改变VGG16模型的最后一个全连接层。

这种方法可以帮助您快速构建适用于特定任务的模型,而无需从头开始训练整个网络。

完整代码如下:

python 复制代码
import torchvision
from torch import nn
from torchvision.models import VGG16_Weights

# train_data = torchvision.datasets.ImageNet("D:\\Python_Project\\pytorch\\data_image_net",split="train",download=True,transform=torchvision.transforms.ToTensor())

# 错误原因:参数pretrained自0.13起已弃用,将在0.15后删除,要改用"weights"。
vgg16_false = torchvision.models.vgg16(weights=None)
vgg16_true = torchvision.models.vgg16(weights=VGG16_Weights.DEFAULT)

# print(vgg16_true)

# 要想用于 CIFAR10 数据集, 可以在网络下面多加一行,转成10分类的输出,这样输出的结果,跟下面的不一样,位置不一样
# vgg16_true.add_module('add_Linear',nn.Linear(1000,10))
# print(vgg16_true)

vgg16_true.classifier.add_module('add_linear',nn.Linear(1000,10))
# 层级不同
# 如何利用现有的网络,改变结构
print(vgg16_true)

# 上面是添加层,下面是如何修改VGG里面的层内容
print(vgg16_false)
vgg16_false.classifier[6] = nn.Linear(4096,10)  # 中括号里的内容,是网络输出结果自带的索引,套进这种格式,就可以直接修改那一层的内容
print(vgg16_false)

参考资料:

视频教程:PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】

相关推荐
2601_950760798 小时前
FGF-basic蛋白的结构特征与生物学功能研究
人工智能·深度学习·蛋白
一个天蝎座 白勺 程序猿8 小时前
Oracle替换工程实践深度解析:从迁移挑战到金仓“零改造”实践
数据库·学习·oracle·kingbasees
deephub8 小时前
TPU 架构与 Pallas Kernel 编程入门:从内存层次结构到 FlashAttention
人工智能·python·深度学习·tpu
人工智能培训9 小时前
少量样本下具身智能的新环境快速适应路径
人工智能·深度学习·机器学习
枫叶林FYL9 小时前
【脑电图信号自动睡眠分期(机器学习驱动睡眠质量评估)】第二章 应用场景拓展、可穿戴集成与临床转化挑战
人工智能·深度学习·机器学习
小马学嵌入式~9 小时前
linux开发深度学习-时钟
linux·arm开发·嵌入式硬件·学习
毕设源码-钟学长9 小时前
【开题答辩全过程】以 基于web的书法学习网站的设计与实现为例,包含答辩的问题和答案
学习
皮卡蛋炒饭.9 小时前
学习IO基础
学习
__雨夜星辰__9 小时前
TypeScript 入门学习笔记(面向对象 + 常用设计模式)
前端·学习·typescript
ejjdhdjdjdjdjjsl9 小时前
halcon算子(模板匹配)
人工智能·深度学习