LayerNorm的图是不是画错了

这是网上一张很流行的说明几个 Normalization 区别的图

这图出自Kaiming的文章 Group Norm

但是他这个 Layer Norm 的图是不是画错了? 我大四写毕设的时候就想问🤣🤣🤣 这都几年过去了

我觉得图应该是这样画的,相同颜色的区域做标准化

仨方块代表Batch_size = 3

每个方块内,前后向代表channel维度,左右代表宽,上下代表高

也就是同Batch, xy位置相同的特征像素,不同的channel里做标准化

接下来代码验证一下,只需要在 Channel 维度做一下标准化

python 复制代码
import torch
import torch.nn as nn

# torch.manual_seed(1107)
torch.manual_seed(1942)

# 假设x的形状是(B, W, H, C)
x = torch.rand(32, 256, 256, 128)  # 添加一个维度以匹配四维输入

m = nn.LayerNorm(128, elementwise_affine=False)
m.eval()  # 设置为评估模式

y = m(x)

# 手动计算LayerNorm
x_mean = x.mean(dim=-1, keepdim=True)
x_var = x.var(dim=-1, keepdim=True, unbiased=False)
eps = m.eps

y_manual = (x - x_mean) / ((x_var + eps).sqrt())

print("结果是否一致:", torch.allclose(y, y_manual, atol=1e-6))

(大佬们路过,教我一下🥲🥲🥲)

相关推荐
神算大模型APi--天枢646几秒前
国产硬件架构大模型算力服务平台:本地化部署与标准端口开发的创新实践
大数据·人工智能·科技·深度学习·架构·硬件架构
猎板PCB黄浩1 分钟前
多层电路板技术深度解析:高密度集成时代的核心支撑
网络·人工智能·算法
杜子不疼.2 分钟前
AI Ping:大模型时代的“性能罗盘”——从选型到落地的全流程指南
数据库·人工智能·redis
llilian_162 分钟前
微型低功耗原子钟筑牢多行业时频基准 低功耗原子钟
人工智能·单片机·嵌入式硬件·网络协议·其他·51单片机
500843 分钟前
鸿蒙 Flutter 超级终端适配:多设备流转与状态无缝迁移
java·人工智能·flutter·华为·性能优化·wpf
计算衎4 分钟前
基于python的FastAPI框架目录结构介绍、开发思路和标准开发模板总结
开发语言·python·fastapi
python机器学习ML5 分钟前
机器学习——因果推断方法的DeepIV和因果森林双重机器学习(CausalForestDML)示例
人工智能·机器学习·数据挖掘·数据分析·回归·scikit-learn·sklearn
凤希AI伴侣5 分钟前
AI手机“外挂”争议:是技术革新,还是底线失守?
人工智能·智能手机·凤希ai伴侣
子春一5 分钟前
Flutter 与 AI 融合开发实战:集成大模型、智能图像识别与端侧推理,打造下一代智能应用
人工智能·flutter
song5016 分钟前
鸿蒙 Flutter 应用签名:证书配置与上架实战
人工智能·分布式·python·flutter·华为·开源鸿蒙