深度学习中的正则化和归一化

https://blog.csdn.net/wuxusanren/article/details/131175185

归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。归一化的主要目的是消除不同量纲及单位影响,提高数据间的可比性,同时也有助于加快算法的收敛速度。如softmax等,也常用于数据预处理

正则化是制定一些规则,防止模型过拟合,通常是在loss中体现,如L1正则化(loss + λ |weight|,有助于产生稀疏解,不重要的参数会变成0,因为绝对值的倒数是不变的),L2正则化(loss + λ * weight**2,有助于使模型参数趋于平滑,即参数值不会太大也不会太小,因为次方倒数随着随着数值变大而变大,数值变小而变小); 还有dropout,early stop等防止过拟合

相关推荐
vx_bisheyuange5 分钟前
基于SpringBoot的知识竞赛系统
大数据·前端·人工智能·spring boot·毕业设计
Ryan老房9 分钟前
从LabelImg到TjMakeBot-标注工具的进化史
人工智能·yolo·目标检测·计算机视觉·ai
石去皿9 分钟前
Transformer超全通关笔记:从「Attention 为什么 work」到「工业级落地」的数学+代码+工程万字解析
笔记·深度学习·transformer
Coding茶水间10 分钟前
基于深度学习的吸烟检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
开发语言·人工智能·深度学习·yolo·目标检测·机器学习
Aaron_94511 分钟前
VideoRAG:革新视频理解的检索增强生成技术深度解析
人工智能·音视频
FlameAIStudio12 分钟前
用人格模型去做漫威角色测试,是比娱乐向更严肃的一种设计
人工智能·机器学习·娱乐
心态特好13 分钟前
RAG实战!!本地知识库检索
人工智能
zzz海羊15 分钟前
【CS336】Transformer|2-BPE算法 -> Tokenizer封装
深度学习·算法·语言模型·transformer
Yeats_Liao15 分钟前
显存瓶颈分析:大模型推理过程中的内存管理机制
python·深度学习·神经网络·架构·开源
San30.17 分钟前
LangChain 第二课:拒绝“废话”,用 Zod 强制 AI 输出标准 JSON
人工智能·langchain·json