深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
tedcloud12313 小时前
cc-switch评测:多AI Coding Agent管理工具详解
数据库·人工智能·sql·学习·自动化
高洁0113 小时前
大模型落地行业第一线
人工智能·数据挖掘·transformer·virtualenv·知识图谱
weixin_3975740914 小时前
AI Agent三层架构设计原理
人工智能·dubbo
机 _ 长14 小时前
YOLO12-Mamba:融合MambaVision思想的目标检测创新实践
人工智能·目标检测·计算机视觉
阿里云大数据AI技术14 小时前
阿里云 ES AI 多模态搜索(百炼)
人工智能
活跃的煤矿打工人14 小时前
【星海出品】大模型微调-Part-One
人工智能·语言模型·gpu算力
coldstarry14 小时前
sheng的学习笔记-AI-xgboost
人工智能·机器学习·boosting
2601_9599862414 小时前
M4Markets:把工具可用性做到位——逻辑梳理与提示整理
大数据·人工智能
程序员小崔日记14 小时前
十年后回头看,2026 年或许是程序员行业的转折点
人工智能·ai编程·claudecode
ZzT14 小时前
给 Claude Code 装个 profiler:每个工具调用慢在哪,瀑布流时间线里一眼看见
人工智能·github·claude