深度学习 欠拟合、过拟合讲透

一句话终极总结

欠拟合 = 没学会 (太笨,学不会知识)✅ 过拟合 = 死记硬背(太死,只会背原题,不会举一反三)


一、最通俗比喻:学生考试(100% 看懂)

假设:

  • 上课学知识 = 模型训练(看训练集)
  • 课后作业 = 训练集(做过的题)
  • 期末考试 = 测试集(没见过的新题)

1. 欠拟合(没学会)

学生上课根本没听懂,知识太复杂,脑子太简单,学不会。

  • 课后作业(训练集):做不对,分数很低
  • 期末考试(测试集):也做不对,分数很低

👉 结论:能力太差,连简单的知识都没学会

2. 过拟合(死记硬背)

学生不理解知识,把课后作业原题背下来了

  • 课后作业(训练集):全对,分数满分
  • 期末考试(测试集):全错,分数极低(题稍微变一点就不会)

👉 结论:只会背做过的题,不会举一反三


二、对应到深度学习(简单版)

  • 模型 = 学生
  • 训练数据 = 课后作业
  • 测试数据 = 期末考试
  • 能做对新题 = 泛化能力(举一反三)

1. 欠拟合

模型太简单(比如只有 1 层线性层),学不懂数据的规律。

  • 训练损失:很高(作业做不对)
  • 测试损失:很高(考试考砸)

2. 过拟合

模型太复杂 (比如 20 层多项式),把训练数据里的噪音、错题都背下来了

  • 训练损失:极低,几乎 0(作业全对)
  • 测试损失:非常高(考试崩了)

三、看曲线一眼分辨(最简单)

画两条线:训练损失测试损失

欠拟合曲线

两条线都高高在上,下不去→ 训练差、测试差

过拟合曲线

  • 训练损失:一路往下,快到 0
  • 测试损失:先降,然后突然往上飙→ 训练极好,测试极差

四、对应你刚学的多项式代码(完美对应)

你刚才跑的代码:

  1. 只用 1 阶、2 阶多项式 → 模型太简单 → 欠拟合训练损失高、测试损失高

  2. 用 20 阶多项式 → 模型太复杂 → 过拟合训练损失几乎 0,测试损失爆高

  3. 用 3~4 阶多项式 → 正好 → 正常拟合训练损失低、测试损失也低


五、怎么解决?(菜鸟 3 招)

解决欠拟合(没学会)

  1. 把模型变复杂(加层、加神经元)
  2. 训练更久一点
  3. 减少正则化(别限制太死)

解决过拟合(死记硬背)

  1. 把模型变简单(减层、减神经元)
  2. 加更多数据(让学生见更多题)
  3. 加正则化(惩罚死记硬背,比如 dropout、L2)

终极口诀(背会就满分)

欠拟合:学不会,两边差 过拟合:背原题,训练好、测试崩 正常拟合:学得会,举一反三

相关推荐
南屹川5 分钟前
【API设计】GraphQL实战:从REST到GraphQL的演进
人工智能
KJ_BioMed8 分钟前
当计算生物学遇上生成式AI:从头设计生物分子的“新范式”初探
人工智能·从头设计·生命科学·生物医药·科研干货·科晶生物
明月醉窗台9 分钟前
深度学习(17)YOLO训练中的超参数详解
人工智能·深度学习·yolo
淘矿人18 分钟前
Claude辅助DevOps实践
java·大数据·运维·人工智能·算法·bug·devops
Cosolar26 分钟前
万字详解:RAG 向量索引算法与向量数据库架构及实战
数据库·人工智能·算法·数据库架构·milvus
星浩AI31 分钟前
OpenHuman 对比 OpenClaw、Hermes Agent
人工智能·后端·agent
SeaTunnel42 分钟前
AI 让 SeaTunnel 读源码和调试过时了吗?
大数据·数据库·人工智能·apache·seatunnel·数据同步
搬砖的小码农_Sky1 小时前
AI Agent:WebMCP介绍和具体实现方案
人工智能·ai·人机交互·agi
t_hj1 小时前
大模型微调
人工智能·python·深度学习