深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
宁静致远46882 分钟前
从零构建 RWKV 批量推理服务器:2的幂次动态缩容、异步拷回与向量化采样
人工智能
枫叶梨花2 分钟前
Dify 离线安装 OpenAI API Compatible 插件踩坑记
服务器·人工智能
天风之翼3 分钟前
AI 全栈开发实战(4):知识库与文档管理 —— CRUD API、文件上传、MinIO 集成
人工智能
踩着两条虫5 分钟前
VTJ.PRO v2.4.2 私有化部署与升级实操指南
前端·人工智能·低代码·架构·数据挖掘
leo__5208 分钟前
MATLAB实现UKF(无迹卡尔曼滤波)原理
人工智能·matlab
春日见10 分钟前
决策规划控制面经汇总
人工智能·深度学习·算法·机器学习·自动驾驶
watersink17 分钟前
LocateAnything解读
人工智能
FrameNotWork23 分钟前
HarmonyOS6.1 从图像分类到目标检测的扩展实现
人工智能·harmonyos
智联物联31 分钟前
办公楼转型养老公寓,边缘计算网关实现全场景智慧监护
人工智能·边缘计算·物联网解决方案·工业网关·智慧养老·数采网关·边缘盒子
库拉大叔32 分钟前
工具调用效率对比实测:GPT-5.5与Gemini 3.5 Flash性能评估
java·前端·人工智能