LLM笔记：LayerNorm VS RMSNorm

UQI-LIUWJ2025-01-22 22:59

1 layernorm回顾

机器学习笔记：神经网络层的各种normalization_神经网络normalization-CSDN博客

2 RMSNorm（Root Mean Square Normalization）

LayerNorm 的一种变体，去除了均值计算，只考虑输入向量的平方和

优点：

计算更高效，因为省略了均值计算。
更简单的归一化过程，对某些任务来说性能可能会更好。
在大模型（如 GPT）中应用时表现出与 LayerNorm 相当甚至更好的效果。

缺点：

不处理均值漂移的问题，可能不适用于输入分布偏移较大的情况。

上一篇：AG32 FPGA 的 Block RAM 资源：M9K 使用

下一篇：2025美赛数学建模B题思路+模型+代码+论文

热门推荐

01GitHub 镜像站点 02【超详细教程】手把手教你从微软官网免费下载Windows 10官方原版ISO镜像（2025最新版）03安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）04UV安装并设置国内源 05React CVE-2025-55182漏洞排查与修复指南 06智能库存管理的需求预测模型：从业务痛点到落地代码的完整实践 07BongoCat - 跨平台键盘猫动画工具 08Linux下V2Ray安装配置指南 09本地部署阿里最新开源的Z-Image 10从入门到实战：Gemini 3 使用指南速览