AI学习记录 - 怎么理解 torch 的 torch.nn.BatchNorm2d

画图不易,有用就点个赞

这里创建了一个随机张量,形状为 (4, 3, 4, 4),分别对应

形状为 (batch_size, num_channels, height, width)

batch_size:批次

num_channels: 通道(什么是通道看上一章节)

python 复制代码
input_tensor = torch.randn(4, 3, 4, 4)

创建了个下面这样子的东西

计算归一化是需要参考值的,因为需要知道最大值最小值,已经参与计算的数量,参考值来自于哪里呢,如下

合并起来,可以看到 num_channels = 3,所以分别计算3次

计算均值和方差公式如下:

看不懂是不是,我也看不懂,举个简单的例子

假设一批数字为 [3, 7, 2, 9, 4]

均值

方差

然后进行归一化

计算完之后形状不会改变,只是值变了而已,上面新的数字组合起来均值接近0,方差接近1。其实认识这个计算过程意义不是很大,你就当在实际模型运算的时候,肯定会产生一些很大的值很小的值,假如生成的数据区间在[ 50,120 ],我们需要将这些值传入到激活函数里面,把 50 到120 传sigmoid激活函数里面,基本上都是0.9999...,数据之间根本没差异。

sigmoid函数,不进行归一化

sigmoid函数,归一化,将数字移动到激活函数有明显变化的区域,这就有差异了,充分发挥了激活函数的作用

相关推荐
SariHcr1232 小时前
基于医学图像分类算法研究(五)——基于上次kvasir后扩充数据集再次进行训练测试
人工智能
小陈工2 小时前
Python Web开发入门(十):数据库迁移与版本管理——让数据库变更可控可回滚
前端·数据库·人工智能·python·sql·云原生·架构
GlobalInfo2 小时前
2026全球及中国源网荷储一体化方案市场风险评估及前景规划建议报告
大数据·人工智能
wal13145202 小时前
OpenClaw 2026.4.2 版本更新:默认 YOLO 模式,告别批准提示
人工智能·yolo·openclaw
yanwumuxi3 小时前
Windows本地部署Dify(Docker)
人工智能·docker·语言模型
鼎上西瓜刀3 小时前
labelimg在windows上的使用
人工智能·深度学习
2301_764441333 小时前
大模型的“做梦”机制与Harness Engineering(驾驭工程)
人工智能·语言模型·自然语言处理
夏沫の梦3 小时前
生成式推荐系统:技术演进、核心架构与工业实践
人工智能
AnchorYYC3 小时前
TEI Inference Toolkit - 工业级Embedding/NLI /Reranking服务调用最佳实践
人工智能·python·持续部署·#大模型应用
QYR_113 小时前
多道分析器市场深度分析:核技术应用升级驱动下的数字化转型机遇
人工智能·市场调研