深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
长桥夜波几秒前
【第四十周】VLN
人工智能·计算机视觉
爱摸鱼的打工仔2 分钟前
【VLLM启动大模型共享内存不足-AI知识点】
人工智能
初心未改HD2 分钟前
深度学习之正则化技术详解
人工智能·深度学习
user29876982706543 分钟前
三、Skills 进阶:Fork 模式与上下文控制
人工智能
闵孚龙4 分钟前
Claude Code CLAUDE.md 用户指令覆盖层全解析:AI Agent 记忆系统、上下文工程、规则分层、团队协作与安全治理
人工智能·安全
X54先生(人文科技)4 分钟前
《元创力》纪实录·卷宗2.1 观测续篇试纸:当“社会性死亡”的叙事进入审核队列
人工智能·开源·ai写作·零知识证明
Hector_zh4 分钟前
逐浪 · 第七篇:Trae-SOLO 多端协同 —— 从安装到完成任务的完整流程
人工智能·trae
189228048618 分钟前
NV301固态MT29F32T08GWLBHD6-QJES:B
大数据·服务器·人工智能·科技·缓存
木雷坞10 分钟前
模型评测 Job 卡住:从 PodGroup 到镜像预检的排查记录
人工智能
大模型推理11 分钟前
Nano-vLLM 源码解读 - 8. Chunked Prefill
人工智能