AI学习记录 - 怎么理解 torch 的 torch.nn.BatchNorm2d

画图不易,有用就点个赞

这里创建了一个随机张量,形状为 (4, 3, 4, 4),分别对应

形状为 (batch_size, num_channels, height, width)

batch_size:批次

num_channels: 通道(什么是通道看上一章节)

python 复制代码
input_tensor = torch.randn(4, 3, 4, 4)

创建了个下面这样子的东西

计算归一化是需要参考值的,因为需要知道最大值最小值,已经参与计算的数量,参考值来自于哪里呢,如下

合并起来,可以看到 num_channels = 3,所以分别计算3次

计算均值和方差公式如下:

看不懂是不是,我也看不懂,举个简单的例子

假设一批数字为 [3, 7, 2, 9, 4]

均值

方差

然后进行归一化

计算完之后形状不会改变,只是值变了而已,上面新的数字组合起来均值接近0,方差接近1。其实认识这个计算过程意义不是很大,你就当在实际模型运算的时候,肯定会产生一些很大的值很小的值,假如生成的数据区间在[ 50,120 ],我们需要将这些值传入到激活函数里面,把 50 到120 传sigmoid激活函数里面,基本上都是0.9999...,数据之间根本没差异。

sigmoid函数,不进行归一化

sigmoid函数,归一化,将数字移动到激活函数有明显变化的区域,这就有差异了,充分发挥了激活函数的作用

相关推荐
Data 实验室几秒前
TaskPyro “小龙虾版本”专业爬虫管理平台来了:AI+分布式+IM 机器人,一套搞定企业级爬虫调度
人工智能·分布式·爬虫
飞哥数智坊几秒前
openclaw 安装后第一个 skill——tavily
人工智能
莫叫石榴姐几秒前
本体论:企业智能化转型的核心引擎
大数据·数据仓库·人工智能·面试·职场和发展
Agent产品评测局2 分钟前
企业超自动化落地,如何打通全业务流程的数据孤岛?技术路径全景盘点与选型指南
运维·人工智能·ai·chatgpt·自动化
志栋智能2 分钟前
安全自动化不烧钱:低成本实战策略
运维·网络·人工智能·安全·自动化
zwenqiyu4 分钟前
zwq重链剖分学习笔记,从入门到过掉模板题
笔记·学习
数据皮皮侠8 分钟前
2285 上市公司组织衰退程度【Dec】2010-2024
大数据·人工智能·算法·制造
俊哥V8 分钟前
每日 AI 研究简报 · 2026-03-30
人工智能·ai
汉堡大王952710 分钟前
AI 终于有了"插件系统"——MCP 完全指南
人工智能·aigc
renhongxia111 分钟前
TrustTrade:人类启发的选择性共识降低大型语言模型交易代理的决策不确定性
人工智能·微服务·语言模型·自然语言处理·架构·机器人·知识图谱