深度学习 欠拟合、过拟合讲透

一句话终极总结

欠拟合 = 没学会 (太笨,学不会知识)✅ 过拟合 = 死记硬背(太死,只会背原题,不会举一反三)


一、最通俗比喻:学生考试(100% 看懂)

假设:

  • 上课学知识 = 模型训练(看训练集)
  • 课后作业 = 训练集(做过的题)
  • 期末考试 = 测试集(没见过的新题)

1. 欠拟合(没学会)

学生上课根本没听懂,知识太复杂,脑子太简单,学不会。

  • 课后作业(训练集):做不对,分数很低
  • 期末考试(测试集):也做不对,分数很低

👉 结论:能力太差,连简单的知识都没学会

2. 过拟合(死记硬背)

学生不理解知识,把课后作业原题背下来了

  • 课后作业(训练集):全对,分数满分
  • 期末考试(测试集):全错,分数极低(题稍微变一点就不会)

👉 结论:只会背做过的题,不会举一反三


二、对应到深度学习(简单版)

  • 模型 = 学生
  • 训练数据 = 课后作业
  • 测试数据 = 期末考试
  • 能做对新题 = 泛化能力(举一反三)

1. 欠拟合

模型太简单(比如只有 1 层线性层),学不懂数据的规律。

  • 训练损失:很高(作业做不对)
  • 测试损失:很高(考试考砸)

2. 过拟合

模型太复杂 (比如 20 层多项式),把训练数据里的噪音、错题都背下来了

  • 训练损失:极低,几乎 0(作业全对)
  • 测试损失:非常高(考试崩了)

三、看曲线一眼分辨(最简单)

画两条线:训练损失测试损失

欠拟合曲线

两条线都高高在上,下不去→ 训练差、测试差

过拟合曲线

  • 训练损失:一路往下,快到 0
  • 测试损失:先降,然后突然往上飙→ 训练极好,测试极差

四、对应你刚学的多项式代码(完美对应)

你刚才跑的代码:

  1. 只用 1 阶、2 阶多项式 → 模型太简单 → 欠拟合训练损失高、测试损失高

  2. 用 20 阶多项式 → 模型太复杂 → 过拟合训练损失几乎 0,测试损失爆高

  3. 用 3~4 阶多项式 → 正好 → 正常拟合训练损失低、测试损失也低


五、怎么解决?(菜鸟 3 招)

解决欠拟合(没学会)

  1. 把模型变复杂(加层、加神经元)
  2. 训练更久一点
  3. 减少正则化(别限制太死)

解决过拟合(死记硬背)

  1. 把模型变简单(减层、减神经元)
  2. 加更多数据(让学生见更多题)
  3. 加正则化(惩罚死记硬背,比如 dropout、L2)

终极口诀(背会就满分)

欠拟合:学不会,两边差 过拟合:背原题,训练好、测试崩 正常拟合:学得会,举一反三

相关推荐
小和尚同志7 小时前
AI 自动化测试探索(二):Chrome-devtools MCP
人工智能·e2e·aigc
冬奇Lab9 小时前
Workflow 系列(02):设计范式——四层架构、三种 Context 传递模式与确认门设计
人工智能·agent·工作流引擎
冬奇Lab9 小时前
每日一个开源项目(第145篇):Trellis - 把项目记忆、规范和任务上下文持久化进代码仓库
人工智能·开源·资讯
有道AI情报局9 小时前
Harness即产品
人工智能·agent
罗西的思考10 小时前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
IT_陈寒11 小时前
SpringBoot自动配置的坑,我的API突然就404了
前端·人工智能·后端
笃行35012 小时前
从零到上线:用 EdgeOne Makers + CodeBuddy 搭一个「对账核对员」AI Agent
人工智能
用户68563262086912 小时前
Claude Code 乱猜字段名?我给它写了一个"数据库查询约束 Skill"
人工智能
你_好12 小时前
# 给你的产品嵌入一个「会操作界面的 AI 助手」
人工智能
ShallWeL12 小时前
【机器学习】(3)—— 线性回归:梯度下降
人工智能·机器学习