深度学习(11):偏差与方差诊断、学习曲线

一、引言

在完成了线性回归、逻辑回归以及梯度下降的学习之后,我们已经能够训练一个模型。但一个更重要的问题随之而来:

模型效果不好,到底是哪里出了问题?

本篇笔记将围绕以下四个核心内容展开:

  • 偏差与方差的诊断(Bias & Variance)

  • 正则化对偏差与方差的影响

  • 基准性能水平(Baseline)的建立

  • 学习曲线(Learning Curves)的分析方法

这些内容是模型调优的核心基础。


二、偏差与方差(Bias & Variance)

2.1 什么是偏差与方差?

在机器学习中,我们通常用两个指标来描述模型问题:

  • 偏差(Bias):模型过于简单,无法拟合数据(欠拟合)

  • 方差(Variance):模型过于复杂,对训练数据拟合过度(过拟合)

2.2 如何判断偏差与方差?

我们通过两个误差来进行判断:

  • 训练误差:

  • 验证误差:

常见判断如下:

情况 结论
都很高 高偏差(欠拟合)
差距大 高方差(过拟合)
都很低 模型良好

关键思想:

模型是否学会训练数据(看

模型是否泛化到新数据(看


三、正则化与偏差方差

3.1 什么是正则化?

正则化的作用是限制模型复杂度,防止过拟合

常见形式(L2 正则化):

其中:

  • λ:正则化强度

3.2 正则化对模型的影响

λ大小 模型情况 偏差 方差
λ很小 模型复杂 低偏差 高方差
λ很大 模型简单 高偏差 低方差

结论:

正则化是调节偏差-方差平衡的重要工具


四、建立基准性能水平(Baseline)

4.1 为什么需要 Baseline?

在实际问题中,我们不能只看误差大小,还需要一个参考标准。

比如:

  • 人类水平错误率

  • 现有系统表现

  • 简单模型效果

4.2 如何使用 Baseline?

我们通常用 Baseline 来判断:

  • 当前模型是否还有提升空间

  • 是不是已经接近最优

4.3 结合 Bias 判断

情况 判断
高偏差
偏差正常

关键理解:

偏差不是绝对的,而是相对于可达到的最好水平


五、学习曲线(Learning Curves)

5.1 什么是学习曲线?

学习曲线描述的是:

  • 训练误差

  • 验证误差

随着训练样本数量变化而变化的趋势。

5.2 两种典型情况

情况1:高偏差(欠拟合)

特点:

  • ​ 高

  • 两者接近

表现:

  • 增加数据没有明显帮助
情况2:高方差(过拟合)

特点:

  • 差距大

表现:

  • 增加数据可以明显改善

5.3 学习曲线的核心作用

用来判断:

  • 是否需要更多数据

  • 是否需要更复杂模型

  • 是否需要正则化


六、整体总结

我们可以把本章内容总结为一个完整流程:

  1. 训练模型,得到

  2. 与 Baseline 对比,判断偏差

  3. 比较 ​,判断方差

  4. 根据问题选择优化方向:

问题 解决方案
高偏差 增加模型复杂度、减少正则化
高方差 增加数据、加强正则化
相关推荐
QQ676580085 分钟前
智慧工厂之扬尘识别 铲车装载识别 工程重型机械识别 磁铁识别 深度学习YOLO格式图像识别第10435期
人工智能·深度学习·yolo·扬尘识别·铲车装载·工程重型机械·磁铁识别
Raink老师9 分钟前
【AI面试临阵磨枪】KV Cache 是什么?为什么能加速推理?如何实现?
人工智能·ai 面试
2601_949817929 分钟前
大厂Java进阶面试解析笔记文档
java·笔记·面试
John.Lewis29 分钟前
C++进阶(12)附加学习:STL之空间配置器(了解)
开发语言·c++·笔记
独小乐30 分钟前
019.ADC转换和子中断|千篇笔记实现嵌入式全栈/裸机篇
linux·c语言·驱动开发·笔记·嵌入式硬件·mcu·arm
xuanwenchao31 分钟前
ROS2学习笔记 - 2、类的继承及使用
服务器·笔记·学习
newsxun40 分钟前
第十六届北京国际电影节东郎分会场启幕
人工智能
大嘴皮猴儿41 分钟前
从零开始学商品图翻译:小白也能快速掌握的多语言文字处理与上架技巧
大数据·ide·人工智能·macos·新媒体运营·xcode·自动翻译
思绪无限43 分钟前
YOLOv5至YOLOv12升级:行人跌倒检测系统的设计与实现(完整代码+界面+数据集项目)
深度学习·yolo·目标检测·yolov12·yolo全家桶·行人跌倒检测系统
大黄说说44 分钟前
AI大模型对内容创作的颠覆:机遇、版权争议与行业新规则
人工智能