AI学习记录 - 怎么理解 torch 的 torch.nn.BatchNorm2d

画图不易,有用就点个赞

这里创建了一个随机张量,形状为 (4, 3, 4, 4),分别对应

形状为 (batch_size, num_channels, height, width)

batch_size:批次

num_channels: 通道(什么是通道看上一章节)

python 复制代码
input_tensor = torch.randn(4, 3, 4, 4)

创建了个下面这样子的东西

计算归一化是需要参考值的,因为需要知道最大值最小值,已经参与计算的数量,参考值来自于哪里呢,如下

合并起来,可以看到 num_channels = 3,所以分别计算3次

计算均值和方差公式如下:

看不懂是不是,我也看不懂,举个简单的例子

假设一批数字为 [3, 7, 2, 9, 4]

均值

方差

然后进行归一化

计算完之后形状不会改变,只是值变了而已,上面新的数字组合起来均值接近0,方差接近1。其实认识这个计算过程意义不是很大,你就当在实际模型运算的时候,肯定会产生一些很大的值很小的值,假如生成的数据区间在[ 50,120 ],我们需要将这些值传入到激活函数里面,把 50 到120 传sigmoid激活函数里面,基本上都是0.9999...,数据之间根本没差异。

sigmoid函数,不进行归一化

sigmoid函数,归一化,将数字移动到激活函数有明显变化的区域,这就有差异了,充分发挥了激活函数的作用

相关推荐
连线Insight13 小时前
3.5亿月活后,豆包收费是一场冒险吗?
大数据·人工智能
大树8813 小时前
PUE 1.25红线遇上2300瓦芯片:为什么数据中心开始“算不过来账“了?
人工智能
dayuOK630713 小时前
不会写文案?我用“看图说话”的方法,10分钟搞定一篇
人工智能·职场和发展·新媒体运营·媒体
G皮T13 小时前
【人工智能】小镇AI助手诞生记(一文记住40+新兴技术名词)
人工智能·ai·agent·多模态·具身智能·skill·openclaw
数智工坊13 小时前
【DDIM 论文阅读】:扩散模型加速采样的里程碑!10~50 倍快采 + 确定性生成
论文阅读·人工智能·深度学习·cnn·transformer
Jmayday13 小时前
Pytorch:问题整理
人工智能·pytorch·python
做萤石二次开发的哈哈13 小时前
萤石×广联达 | 智能视觉融合数字建造,让工地更透明、更安全
人工智能·安全·音视频·智能硬件
aichitang202413 小时前
AI Agent 终端与系统级自动化深度指南
运维·人工智能·自动化
诸葛亮的芭蕉扇13 小时前
前端开发借助GitHub开源项目提升AI能力
人工智能·开源·github
飞Link13 小时前
2026 AI 局势突变:国家大基金入场 DeepSeek,Kimi 2.0 豪掷 20 亿美元,大模型进入“内力”博弈时代
人工智能