PyTorch入门备忘-4-torchvision

Torchvision

torchvisionpytorch的一个图形库,它服务于PyTorch深度学习框架的,主要用来构建计算机视觉模型

  • torchvision.datasets: 一些加载数据的函数及常用的数据集接口;
  • torchvision.models: 包含常用的模型结构(含预训练模型),例如AlexNet、VGG、ResNet等;
  • torchvision.transforms: 常用的图片变换,例如裁剪、旋转等;
  • torchvision.utils: 其他的一些有用的方法。

数据集准备 - CIFAR10

此次代码中要用到的数据集,见附件有 介绍与中文的参数。

下载数据集-CIFAR10

通过py代码

python 复制代码
# 使用CIFAR10数据集
# 训练集
# 如果下载比较慢,可以将控制台打印的下载链接放到专门的下载工具中下载
# 首先下载的是一个压缩包,会自动解压

train_set = torchvision.datasets.CIFAR10(root="./torchvision_dataset", train=True, download=True)


# 测试集
test_set = torchvision.datasets.CIFAR10(root="./torchvision_dataset", train=False, download=True)

运行代码,控制台显示如下信息

50000 -- 说明有5w张训练数据

10000 --说明有1w张测试数据

会自动下载数据集到torchvision_dataset文件夹

已下载就不会继续下载,控制台会出输Files already downloaded and verified字样

代码

目标: torchvision和transform的联合使用

python 复制代码
import torchvision.datasets
from torch.utils.tensorboard import SummaryWriter

# 将图片数据都转为tensor类型
# 可以对数据集做任何transforms范围内的操作,该例子只针对数据做toTensor
dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor
])

# 使用CIFAR10数据集
train_set = torchvision.datasets.CIFAR10(root="./torchvision_dataset",  train=True, transform=dataset_transform, download=True)

# 测试集
test_set = torchvision.datasets.CIFAR10(root="./torchvision_dataset", train=False, transform=dataset_transform, download=True)


# 用tensorboard显示前10张图片
# 运行tensorboard  --logdir=p10
writer = SummaryWriter('p10')
for i in range(0):
    img, target = test_set[i]
    writer.add_image("test_set", img,i)

writer.close()

附:Torchvision介绍

torchvision.datasets: 一些加载数据的函数及常用的数据集接口;

torchvision.models: 包含常用的模型结构(含预训练模型),例如AlexNet、VGG、ResNet等;

torchvision.transforms: 常用的图片变换,例如裁剪、旋转等;

torchvision.utils: 其他的一些有用的方法。

pytorch官网

Pytorch的官网:pytorch.org/

上图是官方的首页,图中同时标出了Docs菜单下常用的子菜单项目,其中torchvision与视觉相关,transform就出自于出此。

torchvison.dataset

进入 torchvision-> datasets 菜单可以找到相当的数据集链接,如下图

其中:

  • COCO: 用于目标检测,语义分割

MNIST

MNIST 常用的入门级数据集,手写文字数据集

包名 torchvision.datasets.MNIST()

Fashion MNIST

该数据集与 MNIST 类似,但该数据集不是手写数字,而是 T 恤、裤子、包等服装项目。

包名 torchvision.datasets.FashionMNIST()

CIFAR10

CIFAR10由10个不同标签的图像组成。其中包括卡车、青蛙、船、汽车、鹿等常见图像。还有一个CIFAR100版本,有 100 个不同的类别

CIFAR10/CIFAR100一般用于物价识别,其广泛用于机器学习领域的计算机视觉算法基准测试。详情 官网地址 包名 torchvision.datasets.FashionMNIST()

包名 torchvision.datasets.CIFAR10()

参数说明:

  • root: 数据集根路径,可以是相对路径
  • train: = ture 训练集,否则为测试集
  • transform: 对数据集进行的transform操作
  • target_transform: 训练后的目标数据集执行指定的transform操作
  • download:=true 自动下载数据集,false不会下载

COOC

目前有超过 100,000 个日常物品,如人、瓶子、文具、书籍等。这个图像数据集广泛用于对象检测和图像描述. (来自知乎...)

torchvision.models

提供神经网络常见的神经网络,有一些神经网络已经预训练好了。

torchvision.transform

图像处理与变形等

torchvision.utils

提供一些常用的工具,比如tensorboard

javascript 复制代码
from torch.utils.tensorboard import SummaryWriter

创建于:2012/11/10

参考

www.bilibili.com/video/BV1hE...

pytorch.org/vision/stab...

相关推荐
聆风吟º10 分钟前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
KYGALYX15 分钟前
服务异步通信
开发语言·后端·微服务·ruby
uesowys18 分钟前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_567818 分钟前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
掘了21 分钟前
「2025 年终总结」在所有失去的人中,我最怀念我自己
前端·后端·年终总结
User_芊芊君子21 分钟前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
爬山算法1 小时前
Hibernate(90)如何在故障注入测试中使用Hibernate?
java·后端·hibernate
智驱力人工智能1 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_160144871 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile1 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算