深度学习(11):偏差与方差诊断、学习曲线

一、引言

在完成了线性回归、逻辑回归以及梯度下降的学习之后,我们已经能够训练一个模型。但一个更重要的问题随之而来:

模型效果不好,到底是哪里出了问题?

本篇笔记将围绕以下四个核心内容展开:

  • 偏差与方差的诊断(Bias & Variance)

  • 正则化对偏差与方差的影响

  • 基准性能水平(Baseline)的建立

  • 学习曲线(Learning Curves)的分析方法

这些内容是模型调优的核心基础。


二、偏差与方差(Bias & Variance)

2.1 什么是偏差与方差?

在机器学习中,我们通常用两个指标来描述模型问题:

  • 偏差(Bias):模型过于简单,无法拟合数据(欠拟合)

  • 方差(Variance):模型过于复杂,对训练数据拟合过度(过拟合)

2.2 如何判断偏差与方差?

我们通过两个误差来进行判断:

  • 训练误差:

  • 验证误差:

常见判断如下:

情况 结论
都很高 高偏差(欠拟合)
差距大 高方差(过拟合)
都很低 模型良好

关键思想:

模型是否学会训练数据(看

模型是否泛化到新数据(看


三、正则化与偏差方差

3.1 什么是正则化?

正则化的作用是限制模型复杂度,防止过拟合

常见形式(L2 正则化):

其中:

  • λ:正则化强度

3.2 正则化对模型的影响

λ大小 模型情况 偏差 方差
λ很小 模型复杂 低偏差 高方差
λ很大 模型简单 高偏差 低方差

结论:

正则化是调节偏差-方差平衡的重要工具


四、建立基准性能水平(Baseline)

4.1 为什么需要 Baseline?

在实际问题中,我们不能只看误差大小,还需要一个参考标准。

比如:

  • 人类水平错误率

  • 现有系统表现

  • 简单模型效果

4.2 如何使用 Baseline?

我们通常用 Baseline 来判断:

  • 当前模型是否还有提升空间

  • 是不是已经接近最优

4.3 结合 Bias 判断

情况 判断
高偏差
偏差正常

关键理解:

偏差不是绝对的,而是相对于可达到的最好水平


五、学习曲线(Learning Curves)

5.1 什么是学习曲线?

学习曲线描述的是:

  • 训练误差

  • 验证误差

随着训练样本数量变化而变化的趋势。

5.2 两种典型情况

情况1:高偏差(欠拟合)

特点:

  • ​ 高

  • 两者接近

表现:

  • 增加数据没有明显帮助
情况2:高方差(过拟合)

特点:

  • 差距大

表现:

  • 增加数据可以明显改善

5.3 学习曲线的核心作用

用来判断:

  • 是否需要更多数据

  • 是否需要更复杂模型

  • 是否需要正则化


六、整体总结

我们可以把本章内容总结为一个完整流程:

  1. 训练模型,得到

  2. 与 Baseline 对比,判断偏差

  3. 比较 ​,判断方差

  4. 根据问题选择优化方向:

问题 解决方案
高偏差 增加模型复杂度、减少正则化
高方差 增加数据、加强正则化
相关推荐
桃花键神9 小时前
Bright Data Web Scraping指南 2026: 使用 MCP + Dify 自动采集海外社交媒体数据
大数据·前端·人工智能
koo3649 小时前
周报5.10
笔记
岁月标记9 小时前
RLHF 基于人类反馈的强化学习简介
人工智能
Ian在掘金10 小时前
从零实现一个 PDF 智能问答系统
人工智能·langchain
飞Link10 小时前
智能体时代的“紧箍咒”:深度解析 Agent 治理架构与 AI 杀伤开关
人工智能·架构
飞Link10 小时前
2000 亿砸向算力:字节跳动 AI 基建跨越,后端与运维的“万亿 Token”生死战
运维·人工智能
zhangfeng113310 小时前
小龙虾 wordbuddy 安装浏览器控制器 agent-browser npm install -g agent-browse
前端·人工智能·npm·node.js
阿里云大数据AI技术10 小时前
一条 SQL 生成广告:Hologres 如何实现素材生成到投放分析一体化
人工智能·sql
liudanzhengxi10 小时前
GitSubmodule避坑全攻略
人工智能·新人首发
用户4252108006010 小时前
Claude Code Linux 服务器部署与配置
人工智能