深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
serve the people15 小时前
TensorFlow 中雅可比矩阵计算方式
人工智能·矩阵·tensorflow
吉吉安15 小时前
vercel ai sdk使用指南(Nextjs版本)
人工智能·大模型·llm·nodejs·vercel
zhaodiandiandian15 小时前
AI伦理治理:在创新与规范之间寻找平衡
人工智能
小毅&Nora15 小时前
【人工智能】【深度学习】 ⑧ 一文讲清Transformer工作原理:从自注意力到大语言模型的革命
人工智能·深度学习·transformer
hjs_deeplearning15 小时前
应用篇#4:Qwen2视觉语言模型(VLM)的服务器部署
服务器·人工智能·python·深度学习·语言模型
小陈phd15 小时前
大模型从入门到精通(一)——大语言模型微调的前沿技术与应用
人工智能·语言模型·自然语言处理
InfiSight智睿视界15 小时前
连锁餐饮管理的“不可能三角”:如何用技术实现规模、效率与体验的平衡?
人工智能
iiiiii1115 小时前
【论文阅读笔记】FOCAL 离线元强化学习,从静态数据中快速适应新任务
论文阅读·人工智能·笔记·学习·机器学习·学习方法·具身智能
百胜软件@百胜软件15 小时前
百胜软件×头部影院:以数字之力,重塑影院零售新体验
人工智能