深度学习 欠拟合、过拟合讲透

一句话终极总结

欠拟合 = 没学会 (太笨,学不会知识)✅ 过拟合 = 死记硬背(太死,只会背原题,不会举一反三)


一、最通俗比喻:学生考试(100% 看懂)

假设:

  • 上课学知识 = 模型训练(看训练集)
  • 课后作业 = 训练集(做过的题)
  • 期末考试 = 测试集(没见过的新题)

1. 欠拟合(没学会)

学生上课根本没听懂,知识太复杂,脑子太简单,学不会。

  • 课后作业(训练集):做不对,分数很低
  • 期末考试(测试集):也做不对,分数很低

👉 结论:能力太差,连简单的知识都没学会

2. 过拟合(死记硬背)

学生不理解知识,把课后作业原题背下来了

  • 课后作业(训练集):全对,分数满分
  • 期末考试(测试集):全错,分数极低(题稍微变一点就不会)

👉 结论:只会背做过的题,不会举一反三


二、对应到深度学习(简单版)

  • 模型 = 学生
  • 训练数据 = 课后作业
  • 测试数据 = 期末考试
  • 能做对新题 = 泛化能力(举一反三)

1. 欠拟合

模型太简单(比如只有 1 层线性层),学不懂数据的规律。

  • 训练损失:很高(作业做不对)
  • 测试损失:很高(考试考砸)

2. 过拟合

模型太复杂 (比如 20 层多项式),把训练数据里的噪音、错题都背下来了

  • 训练损失:极低,几乎 0(作业全对)
  • 测试损失:非常高(考试崩了)

三、看曲线一眼分辨(最简单)

画两条线:训练损失测试损失

欠拟合曲线

两条线都高高在上,下不去→ 训练差、测试差

过拟合曲线

  • 训练损失:一路往下,快到 0
  • 测试损失:先降,然后突然往上飙→ 训练极好,测试极差

四、对应你刚学的多项式代码(完美对应)

你刚才跑的代码:

  1. 只用 1 阶、2 阶多项式 → 模型太简单 → 欠拟合训练损失高、测试损失高

  2. 用 20 阶多项式 → 模型太复杂 → 过拟合训练损失几乎 0,测试损失爆高

  3. 用 3~4 阶多项式 → 正好 → 正常拟合训练损失低、测试损失也低


五、怎么解决?(菜鸟 3 招)

解决欠拟合(没学会)

  1. 把模型变复杂(加层、加神经元)
  2. 训练更久一点
  3. 减少正则化(别限制太死)

解决过拟合(死记硬背)

  1. 把模型变简单(减层、减神经元)
  2. 加更多数据(让学生见更多题)
  3. 加正则化(惩罚死记硬背,比如 dropout、L2)

终极口诀(背会就满分)

欠拟合:学不会,两边差 过拟合:背原题,训练好、测试崩 正常拟合:学得会,举一反三

相关推荐
天天爱吃肉82181 小时前
空间智能上车:新能源OEM决胜「第三空间」的底层技术革命|研发工程师深度解析
大数据·人工智能·嵌入式硬件·汽车
开开心心就好1 小时前
支持批量添加水印的实用工具推荐
人工智能·游戏·ci/cd·docker·音视频·语音识别·媒体
毕胜客源码1 小时前
卷积神经网络的手势识别系统(有技术文档)深度学习 图像识别 卷积神经网络 Django python 人工智能
人工智能·python·深度学习·cnn·django
戏言zare1 小时前
基于改进EfficientNet的植物性状预测系统设计
人工智能
Elastic 中国社区官方博客1 小时前
通过受管控的控制平面加速商品陈列优化
大数据·数据库·人工智能·elasticsearch·搜索引擎·平面·ai
CoderJia程序员甲1 小时前
GitHub 热榜项目 - 日榜(2026-04-28)
人工智能·ai·大模型·github·ai教程
我是大聪明.1 小时前
大模型Tokenizer原理:BPE、WordPiece与子词编码的核心机制深度解析
人工智能·线性代数·算法·机器学习·矩阵
hhhhhh_we1 小时前
再定义“皮肤人格”:从Baumann 16型分型到预颜美历的AI时序人格
前端·图像处理·人工智能·python·aigc
石榴树下的七彩鱼1 小时前
OCR API价格对比2026:身份证/发票/医疗票据识别哪家性价比最高?含Python对接+成本公式
开发语言·人工智能·python·ocr·图像识别·文字识别·api接口