深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
qiyongwork几秒前
AI冲击下的中小软件企业战略
人工智能
逻辑驱动的ken几秒前
Java高频面试考点场景题15
java·开发语言·深度学习·面试·职场和发展·高效学习
花间相见1 分钟前
【LamaIndex01】—— 用于RAG上下文增强型大语言模型应用程序的框架
人工智能·语言模型·自然语言处理
ting94520002 分钟前
Qwen3.5-27B 全方位技术解析与实战指南
人工智能
AI360labs_atyun2 分钟前
GPT-5.5 和 DeepSeek V4同期发布,谁更行?
人工智能·gpt·学习·ai·agi
川石课堂软件测试2 分钟前
AI如何赋能软件测试行业的发展
人工智能·python·功能测试·网络协议·单元测试·测试用例·prometheus
学弟2 分钟前
【内涵】transformer之位置编码
人工智能·深度学习·transformer
IT_陈寒5 分钟前
被JavaScript的隐式类型转换坑到怀疑人生
前端·人工智能·后端
珠海西格电力6 分钟前
零碳园区管理系统“云-边-端”架构协同的核心价值
大数据·人工智能·分布式·微服务·架构·能源