【深度学习教程——01_深度基石(Foundation)】05_数据太多怎么吃?Mini-batch训练的设计模式

05_数据太多怎么吃?Mini-batch训练的设计模式

本章目标:解决"数据量太大,显存放不下"的问题。从全量训练 (Batch) 进化到分批训练 (Mini-batch)。


📖 目录

  1. [Epoch, Batch, Iteration](#Epoch, Batch, Iteration)
  2. [DataLoader 流水线](#DataLoader 流水线)
  3. [实战:自定义 Dataset](#实战:自定义 Dataset)
  4. [实战:使用 DataLoader](#实战:使用 DataLoader)

1. Epoch, Batch, Iteration

  • Epoch: 所有样本训练一次。
  • Batch Size: 每次喂给模型多少个样本。
  • Iteration: 更新一次参数。

2. DataLoader 流水线

PyTorch 的数据加载是多线程的。

  1. Disk: 数据在硬盘。
  2. Workers:多进程读取。
  3. Queue: 放入内存队列。
  4. Collate: 拼成 Batch Tensor。
  5. GPU: 模型计算。

3. 实战:自定义 Dataset

python 复制代码
from torch.utils.data import Dataset, DataLoader
import torch
import numpy as np

class DiabetesDataset(Dataset):
    def __init__(self, filepath):
        xy = np.loadtxt(filepath, delimiter=',', dtype=np.float32)
        self.len = xy.shape[0]
        self.x_data = torch.from_numpy(xy[:, :-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]

    def __len__(self):
        return self.len

dataset = DiabetesDataset('diabetes.csv.gz')
train_loader = DataLoader(dataset=dataset, batch_size=32, shuffle=True, num_workers=2)

4. 实战:使用 DataLoader

python 复制代码
for epoch in range(100):
    for i, data in enumerate(train_loader, 0):
        # 1. Prepare data
        inputs, labels = data
        # 2. Forward
        y_pred = model(inputs)
        loss = criterion(y_pred, labels)
        # 3. Backward
        optimizer.zero_grad()
        loss.backward()
        # 4. Update
        optimizer.step()

➡️ 下一章:06_一层不够怎么办?多层感知机与万能逼近

相关推荐
好评笔记6 小时前
机器学习面试八股——常用损失函数
人工智能·深度学习·算法·机器学习·校招
weixin_468466856 小时前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
小糖学代码6 小时前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络
voidmort8 小时前
3. 微调(Fine-tuning)与强化学习(RL)的核心思想
python·深度学习·算法
keyanbanyungong9 小时前
告别杂乱病历!临床科研AI工具实测
人工智能·深度学习
z小猫不吃鱼11 小时前
13 Scaling Law 入门:模型规模、数据规模和计算量是什么关系?
人工智能·深度学习·机器学习
知识浅谈12 小时前
Transformer 中的 Q、K、V 到底是什么?怎么理解 Query、Key、Value?
人工智能·深度学习·transformer
人工智能培训12 小时前
设备故障?数字孪生提前预警
人工智能·深度学习·神经网络·机器学习·生成对抗网络
weixin_4684668513 小时前
千问大模型在阿里生态中的实战应用指南
大数据·人工智能·深度学习·ai·大模型·智能交互·自动应答
wangqiaowq14 小时前
预训练 后预训练 微调
人工智能·深度学习·机器学习