深度学习 欠拟合、过拟合讲透

一句话终极总结

欠拟合 = 没学会 (太笨,学不会知识)✅ 过拟合 = 死记硬背(太死,只会背原题,不会举一反三)


一、最通俗比喻:学生考试(100% 看懂)

假设:

  • 上课学知识 = 模型训练(看训练集)
  • 课后作业 = 训练集(做过的题)
  • 期末考试 = 测试集(没见过的新题)

1. 欠拟合(没学会)

学生上课根本没听懂,知识太复杂,脑子太简单,学不会。

  • 课后作业(训练集):做不对,分数很低
  • 期末考试(测试集):也做不对,分数很低

👉 结论:能力太差,连简单的知识都没学会

2. 过拟合(死记硬背)

学生不理解知识,把课后作业原题背下来了

  • 课后作业(训练集):全对,分数满分
  • 期末考试(测试集):全错,分数极低(题稍微变一点就不会)

👉 结论:只会背做过的题,不会举一反三


二、对应到深度学习(简单版)

  • 模型 = 学生
  • 训练数据 = 课后作业
  • 测试数据 = 期末考试
  • 能做对新题 = 泛化能力(举一反三)

1. 欠拟合

模型太简单(比如只有 1 层线性层),学不懂数据的规律。

  • 训练损失:很高(作业做不对)
  • 测试损失:很高(考试考砸)

2. 过拟合

模型太复杂 (比如 20 层多项式),把训练数据里的噪音、错题都背下来了

  • 训练损失:极低,几乎 0(作业全对)
  • 测试损失:非常高(考试崩了)

三、看曲线一眼分辨(最简单)

画两条线:训练损失测试损失

欠拟合曲线

两条线都高高在上,下不去→ 训练差、测试差

过拟合曲线

  • 训练损失:一路往下,快到 0
  • 测试损失:先降,然后突然往上飙→ 训练极好,测试极差

四、对应你刚学的多项式代码(完美对应)

你刚才跑的代码:

  1. 只用 1 阶、2 阶多项式 → 模型太简单 → 欠拟合训练损失高、测试损失高

  2. 用 20 阶多项式 → 模型太复杂 → 过拟合训练损失几乎 0,测试损失爆高

  3. 用 3~4 阶多项式 → 正好 → 正常拟合训练损失低、测试损失也低


五、怎么解决?(菜鸟 3 招)

解决欠拟合(没学会)

  1. 把模型变复杂(加层、加神经元)
  2. 训练更久一点
  3. 减少正则化(别限制太死)

解决过拟合(死记硬背)

  1. 把模型变简单(减层、减神经元)
  2. 加更多数据(让学生见更多题)
  3. 加正则化(惩罚死记硬背,比如 dropout、L2)

终极口诀(背会就满分)

欠拟合:学不会,两边差 过拟合:背原题,训练好、测试崩 正常拟合:学得会,举一反三

相关推荐
云烟成雨TD10 小时前
Spring AI 1.x 系列【50】可观测性:接入 Prometheus + Grafana
人工智能·spring·prometheus
梦梦代码精10 小时前
为什么这个开源的AI平台会火?有点东西。。。
人工智能·算法·机器学习·docker·开源
大模型真好玩10 小时前
智能体从入门到精通:6个必学GitHub开源项目
人工智能·agent·deepseek
源图客11 小时前
Aitoearn:OPC(一人公司)的AI内容智能体
人工智能·dreamweaver
逸模11 小时前
AI+BIM 重构连锁公装新范式 逸模打造数字化营建核心底座
大数据·人工智能·笔记·其他·信息可视化·重构
phltxy11 小时前
MCP 从协议到 Spring AI 实战
人工智能·spring·oracle
Sirius Wu11 小时前
Agentic端到端&分离式RL技术建设
人工智能·深度学习·机器学习·caffe
AI导出鸭PC端12 小时前
智谱清言怎么生成word文档?AI导出鸭终结乱码烦恼
人工智能·ai·c#·word·豆包·ai导出鸭
格桑阿sir12 小时前
17-大模型智能体开发工程师:深入学习Agent记忆系统
人工智能·记忆存储·记忆系统·agent记忆·嵌入式数据库·agent进化·记忆检索