一、训练流程中的"检查点"记忆法
数据准备 → 模型定义 → 训练循环 → 结果评估
在每个节点,都能判断、预防或修复过/欠拟合。
二、按写代码顺序串联
第1步:准备数据
| 现象判断 | 原因 | 代码上怎么改 |
|---|---|---|
| 数据太少 → 容易过拟合 | 样本不足 | 加数据 / 数据增强 |
| 特征太少/太差 → 欠拟合 | 信息不足 | 特征工程、加交叉特征 |
| 噪声太多 → 过拟合 | 记住噪声 | 清洗数据、异常值处理 |
记忆锚点:先看数据量够不够、干不干净。
第2步:定义模型
| 现象判断 | 原因 | 代码上怎么改 |
|---|---|---|
| 模型太小(层少、神经元少)→ 欠拟合 | 表达力不够 | 加层、加神经元、换复杂模型 |
| 模型太大(参数远超样本量)→ 过拟合 | 容量过剩 | 减少层/神经元、加Dropout/正则化 |
记忆锚点:模型容量要和数据量匹配。
第3步:训练循环中
| 现象判断 | 原因 | 代码上怎么改 |
|---|---|---|
| 训练loss不下降 → 欠拟合 | 没学好 | 调大学习率、增加epoch、改优化器 |
| 训练loss下降、验证loss上升 → 过拟合 | 开始背题 | 早停、降低学习率、加正则化 |
记忆锚点:盯着训练和验证两条loss曲线。
第4步:评估与调优
| 现象判断 | 原因 | 代码上怎么改 |
|---|---|---|
| 训练好、验证差 → 过拟合 | 泛化差 | 上面第2、3步的方案 |
| 训练差、验证也差 → 欠拟合 | 没学会 | 上面第1、2步的方案 |
三、一张代码流程速查表(IDE旁边)
python
# 1. 数据准备
if 训练差 and 验证差: # 欠拟合
→ 加特征 / 特征交叉
if 训练好 and 验证差: # 过拟合
→ 加数据 / 数据增强 / 清洗噪声
# 2. 模型定义
if 欠拟合:
→ 加层 / 加神经元 / 换大模型
if 过拟合:
→ 减层 / 减神经元 / 加Dropout / 加L2
# 3. 训练循环
欠拟合 → 增加epoch / 调大lr
过拟合 → 早停 / 降低lr / 加正则
# 4. 验证时
if 验证loss开始上升:
触发早停 # 代码写Callback
四、一句话记忆(流程版)
先看数据(多少/好坏)→ 再看模型(大小/容量)→ 训练盯曲线(loss走势)→ 早停防过拟合,加epoch治欠拟合
写代码时按这个顺序检查一遍,比背分类表自然得多。