减小泛化误差为什么称“正则化(Regularization)”——深度学习Note

深度学习的一个重要方面是正则化(Regularization),Ian Goodfellow在《Deep Learning 》称正则化(Regularization)就是减小泛化误差。那么,为什么减小泛化误差称为正则化呢?

首先看正则化------Regularization这个单词,Regularization是创造出来的词,在牛津词典和柯林斯词典上都没有,但是有regularize。柯林斯词典对regularize的解释:

If someone regularizes a situation or system, they make it officially acceptable.

说白了,regularize的意思就是把一样东西"打整打整",使它显得"正规"、"正经",好让别人正儿八经认同、接受(make it officially acceptable )。

Regularization是regularize的名词,意思相同。

对于深度学习,用"参数范数惩罚"等策略打整打整模型,减小泛化误差,使大家觉得模型"正规"并认同、接受------得到应用,这自然就是Regularization------正则化。

模型训练------减小训练误差是深度学习的核心。不属于核心的正则化是对模型打整打整,以便减小泛化误差,使之得到应用,也是深度学习的重要方面。

Regularization翻译为正则化这个有点费解的词不是很合适,这个翻译应该是受到regular 在数学上翻译为"正则"的影响。不过,Regularization也确实不好翻译,中文中似乎没有确切的词与之对应,也只有慢慢接受"正则化"这个词了。

相关推荐
浩瀚地学13 小时前
【Java】JDK8的一些新特性
java·开发语言·经验分享·笔记·学习
JeffDingAI13 小时前
【Datawhale学习笔记】深入大模型架构
笔记·学习
a不是橘子14 小时前
03在Ubuntu中验证PV操作
笔记·ubuntu·操作系统·虚拟机·os·pv操作
tangyal14 小时前
渗透笔记1
笔记·网络安全·渗透
fanged15 小时前
STM32(5)--HAL1(TODO)
笔记
grd417 小时前
RN for OpenHarmony 小工具 App 实战:屏幕尺子实现
笔记·harmonyos
丝斯201117 小时前
AI学习笔记整理(50)——大模型中的Graph RAG
人工智能·笔记·学习
小+不通文墨18 小时前
“超声波测量声速”实验报告
经验分享·笔记·学习·学习方法
lihao lihao19 小时前
平衡二叉树
笔记
JavaLearnerZGQ19 小时前
我的Redis笔记2【分布式缓存】
redis·笔记·缓存