Day39

知识点回顾总结

  1. 图像数据的格式

灰度数据:单通道(1个维度),像素值通常为0~255,表示亮度。

彩色数据:三通道(RGB,3个维度),每个通道代表红、绿、蓝的强度。

  1. 模型的定义

指神经网络的架构,包括层数、每层的神经元数量、激活函数等。

定义方式:通过框架(如PyTorch的nn.Module)构建计算图。

  1. 显存占用的4种地方

a. 模型参数 + 梯度参数:存储权重及反向传播时的梯度。

b. 优化器参数:如Adam优化器会保存动量(momentum)等额外变量。

c. 数据批量所占显存:输入数据(batch)的存储空间。

d. 神经元输出中间状态:前向传播时各层的输出(用于反向传播)。

  1. Batch Size 和训练的关系

增大 Batch Size:

提高训练速度(并行计算更高效)。

可能降低模型泛化能力(梯度估计更精确,但易陷入局部最优)。

显存占用增加(需存储更多数据、中间变量)。

减小 Batch Size:

训练更"噪声大"(梯度波动大,可能帮助逃离局部最优)。

显存占用减少,适合小显存设备。

训练速度变慢(数据利用率低)。

平衡点:需根据硬件(显存)和模型效果调整,通常通过实验选择最佳 batch size。


总结:理解数据格式、模型结构、显存分配和 batch size 的影响,能更高效地训练深度学习模型。

相关推荐
luckys.one1 小时前
第9篇:Freqtrade量化交易之config.json 基础入门与初始化
javascript·数据库·python·mysql·算法·json·区块链
大翻哥哥2 小时前
Python 2025:量化金融与智能交易的新纪元
开发语言·python·金融
zhousenshan4 小时前
Python爬虫常用框架
开发语言·爬虫·python
IMER SIMPLE4 小时前
人工智能-python-深度学习-经典神经网络AlexNet
人工智能·python·深度学习
CodeCraft Studio4 小时前
国产化Word处理组件Spire.DOC教程:使用 Python 将 Markdown 转换为 HTML 的详细教程
python·html·word·markdown·国产化·spire.doc·文档格式转换
专注API从业者5 小时前
Python/Java 代码示例:手把手教程调用 1688 API 获取商品详情实时数据
java·linux·数据库·python
java1234_小锋5 小时前
[免费]基于Python的协同过滤电影推荐系统(Django+Vue+sqlite+爬虫)【论文+源码+SQL脚本】
python·django·电影推荐系统·协同过滤
看海天一色听风起雨落6 小时前
Python学习之装饰器
开发语言·python·学习
XiaoMu_0016 小时前
基于Python+Streamlit的旅游数据分析与预测系统:从数据可视化到机器学习预测的完整实现
python·信息可视化·旅游
THMAIL6 小时前
深度学习从入门到精通 - 生成对抗网络(GAN)实战:创造逼真图像的魔法艺术
人工智能·python·深度学习·神经网络·机器学习·生成对抗网络·cnn