Day 43图像数据与显存机制@浙大疏锦行

Day 43 学习笔记:图像数据与显存机制@浙大疏锦行

一、 图像数据基础

  1. 数据形状 (Shape)

    • 结构化数据(样本数, 特征数)

    • 图像数据

      复制代码
      (通道数, 高, 宽)

      PyTorch 默认格式 (Channel First)

      • 灰度图 (如 MNIST):通道数 = 1
      • 彩色图 (如 CIFAR-10):通道数 = 3 (RGB)
  2. 维度陷阱

    • PyTorch 使用 (C, H, W)
    • Matplotlib/OpenCV 通常使用 (H, W, C)
    • 注意 :在使用 plt.imshow() 可视化 PyTorch 张量时,必须先使用 np.transposepermute 交换维度顺序。

二、 图像神经网络 (MLP) 定义

  1. 展平操作 (Flatten)
    • MLP 全连接层只能接收一维向量。
    • 必须在输入层前使用 nn.Flatten()x.view()(C, H, W) 拉平为 (C×H×W) 的一维向量。
  2. Batch Size 与模型定义
    • 模型定义阶段无关nn.Linear 等层定义时不涉及 Batch Size。
    • 数据加载阶段相关DataLoader 中设置 Batch Size。
    • 前向传播:PyTorch 会自动处理第一维度的 Batch,模型内部计算逻辑不变。

三、 显存 (VRAM) 占用分析

显存不仅仅用来存图片,主要由以下 4部分 组成:

组成部分 说明 估算公式 (Float32)
1. 模型参数 模型的权重 (Weights) 和偏置 (Bias) 参数量 ×× 4 Bytes
2. 梯度 反向传播计算出的导数 ≈≈ 参数量 ×× 4 Bytes
3. 优化器状态 优化器更新参数所需的额外信息 SGD : 0 Adam: ≈≈ 参数量 ×× 8 Bytes (动量+方差)
4. 中间变量 & 数据 输入数据 + 每一层的输出特征图 (Activations) 受 Batch Size 影响最大 Batch Size ×× (单样本大小 + 中间层大小)

结论 :模型参数和优化器占用是固定的(这也是为什么大模型很难跑起来),而调整 Batch Size 是控制显存占用的主要手段

四、 Batch Size 的选择策略

  1. 显存限制 (OOM)
    • Batch Size 设置过大会导致 Out Of Memory
    • 建议从 16, 32, 64 开始尝试,通常设置为显卡最大承载能力的 80% 左右。
  2. 对训练的影响
    • Batch Size = 1:梯度随机性大,震荡剧烈,难以收敛。
    • Batch Size 较大:利用矩阵并行计算加速;梯度是多个样本的平均值,方向更准,训练更稳定。

@浙大疏锦行

相关推荐
2301_815279521 分钟前
CSS定位如何实现多行文字垂直居中_通过绝对定位模拟表格
jvm·数据库·python
m0_684501985 分钟前
C#怎么使用LINQ Contains包含判断 C#如何用Contains实现类似SQL IN查询的集合包含判断【语法】
jvm·数据库·python
程序媛徐师姐15 分钟前
Python基于深度学习的手写输入识别系统【附源码、文档说明】
python·深度学习·python深度学习·手写输入识别系统·python手写输入识别系统·python手写输入识别·深度学习手写输入识别
2301_7641505622 分钟前
c++如何读取和解析带BOM头的UTF-8与UTF-16文本流【详解】
jvm·数据库·python
qq_4240985626 分钟前
HTML函数开发用窄边框笔记本有优势吗_便携与性能权衡【指南】
jvm·数据库·python
Wyz2012102429 分钟前
CSS如何实现导航栏下划线随鼠标移动_利用-hover伪类与过渡动画控制
jvm·数据库·python
2201_7610405930 分钟前
SQL如何统计每个用户的首次行为时间_MIN聚合与分组
jvm·数据库·python
qq_1898070335 分钟前
mysql如何实现定时清理缓存数据_利用event scheduler执行
jvm·数据库·python
Polar__Star38 分钟前
golang如何实现低功耗设备唤醒机制_golang低功耗设备唤醒机制实现教程
jvm·数据库·python
a95114164239 分钟前
CSS怎么在flex布局中实现项目均分间距_设置justify-content space-evenly
jvm·数据库·python