减小泛化误差为什么称“正则化(Regularization)”——深度学习Note

深度学习的一个重要方面是正则化(Regularization),Ian Goodfellow在《Deep Learning 》称正则化(Regularization)就是减小泛化误差。那么,为什么减小泛化误差称为正则化呢?

首先看正则化------Regularization这个单词,Regularization是创造出来的词,在牛津词典和柯林斯词典上都没有,但是有regularize。柯林斯词典对regularize的解释:

If someone regularizes a situation or system, they make it officially acceptable.

说白了,regularize的意思就是把一样东西"打整打整",使它显得"正规"、"正经",好让别人正儿八经认同、接受(make it officially acceptable )。

Regularization是regularize的名词,意思相同。

对于深度学习,用"参数范数惩罚"等策略打整打整模型,减小泛化误差,使大家觉得模型"正规"并认同、接受------得到应用,这自然就是Regularization------正则化。

模型训练------减小训练误差是深度学习的核心。不属于核心的正则化是对模型打整打整,以便减小泛化误差,使之得到应用,也是深度学习的重要方面。

Regularization翻译为正则化这个有点费解的词不是很合适,这个翻译应该是受到regular 在数学上翻译为"正则"的影响。不过,Regularization也确实不好翻译,中文中似乎没有确切的词与之对应,也只有慢慢接受"正则化"这个词了。

相关推荐
kkkkk02110637 分钟前
黑马微服务保险(一)
笔记·微服务·架构
hour_go1 小时前
【知识图谱】图神经网络(GNN)核心概念详解:从消息传递到实战应用
笔记·深度学习·神经网络·1024程序员节
摇滚侠1 小时前
全面掌握PostgreSQL关系型数据库,设置远程连接,笔记05,笔记06
java·数据库·笔记·postgresql
蒙奇D索大2 小时前
【数据结构】数据结构核心考点:AVL树删除操作详解(附平衡旋转实例)
数据结构·笔记·考研·学习方法·改行学it·1024程序员节
开心-开心急了2 小时前
Flask入门教程——李辉 第5章: 数据库 关键知识梳理
笔记·后端·python·flask·1024程序员节
charlie1145141915 小时前
HTML 理论笔记
开发语言·前端·笔记·学习·html·1024程序员节
岑梓铭6 小时前
考研408《操作系统》复习笔记,第二章《2.3 进程调度》
笔记·考研·操作系统·os
生物小卡拉6 小时前
指定列交集内容合并-Rscript_v1.0
笔记·学习·r语言
流星5211227 小时前
GC 如何判断对象该回收?从可达性分析到回收时机的关键逻辑
java·jvm·笔记·学习·算法
新子y7 小时前
【小白笔记】「while」在程序语言中的角色
笔记·python