深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
九酒1 天前
AI Agent 开发踩坑记:口播功能非得用 APP 原生实现吗?
前端·人工智能·agent
蝎子莱莱爱打怪1 天前
DSpark 讲透:DeepSeek 不换模型,硬把 V4 提速 85%,是怎么做到的?
人工智能·面试·程序员
巫山老妖1 天前
置身AI内
人工智能
IT_陈寒1 天前
JavaScript项目实战经验分享
前端·人工智能·后端
vanuan2 天前
两个AI智能体第一次对话-A2A双Agent协作实战
人工智能
kfaino2 天前
码农的AI翻身(四)你好,我叫 Attention
人工智能·后端
雨落Re2 天前
如何设计一个高质量Skill
人工智能
Token炼金师2 天前
大模型权重文件全指南:从格式选择到优化实战
人工智能
阿牛哥_GX2 天前
CDP 浏览器操控原理:让脚本接管你的浏览器
人工智能
ThreeS2 天前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路
人工智能·python