5.29打卡

@浙大疏锦行
DAY 38 Dataset和Dataloader类

知识点回顾:

  1. Dataset类的__getitem__和__len__方法(本质是python的特殊方法)

  2. Dataloader类

  3. minist手写数据集的了解

**作业:**了解下cifar数据集,尝试获取其中一张图片

python 复制代码
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader , Dataset # DataLoader 是 PyTorch 中用于加载数据的工具
from torchvision import datasets, transforms # torchvision 是一个用于计算机视觉的库,datasets 和 transforms 是其中的模块
import matplotlib.pyplot as plt
 
# 设置随机种子,确保结果可复现
torch.manual_seed(42)
# 定义数据预处理
transform = transforms.Compose([
    transforms.ToTensor(),  # 将图像转换为Tensor
    transforms.Normalize((0.5, 0.5,0.5), (0.5, 0.5,0.5))  # 归一化处理,将像素值从[0,1]缩放到[-1,1]
])
# 加载训练集
train_dataset = datasets.CIFAR10(
    root='./data',  # 数据存放路径
    train=True,  # 是否为训练集
    download=True,  # 如果数据不存在,是否自动下载
    transform=transform  # 数据预处理
)
 
# 加载测试集
test_dataset = datasets.CIFAR10(
    root='./data',  # 数据存放路径
    train=False,  # 是否为测试集
    transform=transform  # 数据预处理
)
import matplotlib.pyplot as plt
# 类别名称
classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
# 随机选择一张图片,可以重复运行,每次都会随机选择
sample_idx = torch.randint(0, len(train_dataset), size=(1,)).item() # 随机选择一张图片的索引
# len(train_dataset) 表示训练集的图片数量;size=(1,)表示返回一个索引;torch.randint() 函数用于生成一个指定范围内的随机数,item() 方法将张量转换为 Python 数字
image, label = train_dataset[sample_idx] # 获取图片和标签
# 可视化原始图像(需要反归一化)
def imshow(img, title=None):
    img = img / 2 + 0.5  # 反归一化:将[-1,1]范围转回[0,1]
    npimg = img.numpy()
    plt.figure(figsize=(4, 4))
    plt.imshow(np.transpose(npimg, (1, 2, 0)))  # 调整通道顺序:从[C,H,W]到[H,W,C]
    if title:
        plt.title(title)
    plt.axis('off')
    plt.show()
 
print(f"Label: {label} ({classes[label]})")
imshow(image, f"Label: {classes[label]}")
相关推荐
MO2T3 分钟前
使用 Flask 构建基于 Dify 的企业资金投向与客户分类评估系统
后端·python·语言模型·flask
慢热型网友.7 分钟前
用 Docker 构建你的第一个 Python Flask 程序
python·docker·flask
Naiva7 分钟前
【小技巧】Python + PyCharm 小智AI配置MCP接入点使用说明(内测)( PyInstaller打包成 .exe 可执行文件)
开发语言·python·pycharm
云动雨颤11 分钟前
Python 自动化办公神器|一键转换所有文档为 PDF
运维·python
梦子要转行16 分钟前
matlab/Simulink-全套50个汽车性能建模与仿真源码模型9
开发语言·matlab·汽车
moonless022216 分钟前
🌈Transformer说人话版(二)位置编码 【持续更新ing】
人工智能·llm
小爷毛毛_卓寿杰16 分钟前
基于大模型与知识图谱的对话引导意图澄清系统技术解析
人工智能·llm
梅孔立23 分钟前
yum update 报错 Cannot find a valid baseurl for repo: centos-sclo-rh/x86_64 等解决办法
linux·python·centos
聚客AI27 分钟前
解构高效提示工程:分层模型、文本扩展引擎与可视化调试全链路指南
人工智能·llm·掘金·日新计划
前端付豪39 分钟前
13、你还在 print 调试🧾?教你写出自己的日志系统
后端·python