神经网络之经验风险最小化

🧠 一、基本思想

在机器学习中,我们希望找到一个函数(模型)(f(x))( f(x) )(f(x)),使它在真实数据分布 (P(X,Y))( P(X, Y) )(P(X,Y)) 下的**期望风险(真实风险)**最小化:

R(f)=E(X,Y)∼P[L(f(X),Y)] R(f) = \mathbb{E}_{(X,Y)\sim P}[L(f(X), Y)] R(f)=E(X,Y)∼P[L(f(X),Y)]

其中

  • (L(⋅,⋅))( L(\cdot,\cdot) )(L(⋅,⋅)):损失函数(如平方误差、交叉熵等),
  • (f(X))( f(X) )(f(X)):模型的预测输出,
  • (Y)( Y )(Y):真实标签。

但是,真实分布 (P(X,Y))( P(X, Y) )(P(X,Y)) 是未知的,因此我们无法直接计算这个期望风险。


⚙️ 二、经验风险(Empirical Risk)

我们只有一个样本数据集:
S=(x1,y1),(x2,y2),...,(xn,yn) S = {(x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n)} S=(x1,y1),(x2,y2),...,(xn,yn)

经验风险定义为:
Remp(f)=1n∑i=1nL(f(xi),yi) R_{\text{emp}}(f) = \frac{1}{n} \sum_{i=1}^{n} L(f(x_i), y_i) Remp(f)=n1i=1∑nL(f(xi),yi)

也就是在训练样本上的平均损失。


🎯 三、经验风险最小化原则(ERM Principle)

ERM 的思想就是用经验风险来近似真实风险,并在此基础上选择模型:
f∗=arg⁡min⁡f∈FRemp(f) f^* = \arg\min_{f \in \mathcal{F}} R_{\text{emp}}(f) f∗=argf∈FminRemp(f)

换句话说:

我们用训练集的平均损失作为目标函数,找到使其最小的模型。


📉 四、存在的问题

纯粹的 ERM 容易导致 过拟合(overfitting)

模型在训练集上表现很好,但在新样本(测试集)上表现较差。


🛡️ 五、改进:结构风险最小化(SRM)

为了解决过拟合问题,引入了 结构风险最小化(Structural Risk Minimization) ,在经验风险的基础上加上一个正则化项:
Rsrm(f)=Remp(f)+λ,Ω(f) R_{\text{srm}}(f) = R_{\text{emp}}(f) + \lambda , \Omega(f) Rsrm(f)=Remp(f)+λ,Ω(f)

其中:

  • (Ω(f))( \Omega(f) )(Ω(f)):模型复杂度的度量(正则项);
  • (λ)( \lambda )(λ):平衡经验风险与模型复杂度的系数。

这就是许多现代机器学习算法(如岭回归、Lasso、SVM、神经网络正则化等)的理论基础。


✅ 六、总结对比

概念 定义 优缺点
经验风险最小化 (ERM) 在训练集上最小化平均损失 简单易行,但易过拟合
结构风险最小化 (SRM) 在 ERM 基础上加入正则项 抑制过拟合,更具泛化能力
相关推荐
GEO索引未来11 小时前
国内首部GEO可信传播标准立项通过/DeepSeek-V4 正式上线并开源/Open AI、Google继续推进AI广告标准化
大数据·人工智能·gpt·ai·chatgpt·开源
Chengbei1111 小时前
面向红队的 AI 赋能全场景流量分析仪 网页 / APP / 终端 / IoT 全域 HTTPS 抓包解密利器
人工智能·物联网·网络协议·web安全·网络安全·https·系统安全
小糖学代码11 小时前
LLM系列:2.pytorch入门:9.神经网络的学习
人工智能·python·深度学习·神经网络·学习·机器学习
tangweiguo0305198711 小时前
AI图生图完整实战:基于阿里云百炼通义万相
人工智能·langchain
一只AI打工虾的自我修养11 小时前
Mac mini 本地AI工作站配置指南(2026实战):从零打造 M4 Mac mini AI 开发环境
人工智能·macos
CodePlayer竟然被占用了11 小时前
少即是多:GPT-5.5 Prompt 官方指南的核心转变
人工智能
liuyunshengsir11 小时前
手写最基础的大模型推理并使用Profile监控GPU性能消耗情况
人工智能·深度学习·机器学习
翼龙云_cloud11 小时前
阿里云代理商:阿里云部署的Hermes Agent 钉钉接入指南
人工智能·阿里云·云计算·钉钉·ai 智能体·hermes agent
user298769827065411 小时前
五、深入 Claude Code CLI 源码:终端 UI 的 React 实现
人工智能
znhb9911 小时前
九九AI驱动脱硫脱硝及氨逃逸精准控制技术,实现环保、经济、运维三重升级
运维·人工智能