【算法记录1】模型训练问题

一、训练流程中的"检查点"记忆法

复制代码

数据准备 → 模型定义 → 训练循环 → 结果评估

在每个节点，都能判断、预防或修复过/欠拟合。

二、按写代码顺序串联

第1步：准备数据

现象判断	原因	代码上怎么改
数据太少 → 容易过拟合	样本不足	加数据 / 数据增强
特征太少/太差 → 欠拟合	信息不足	特征工程、加交叉特征
噪声太多 → 过拟合	记住噪声	清洗数据、异常值处理

记忆锚点：先看数据量够不够、干不干净。

第2步：定义模型

现象判断	原因	代码上怎么改
模型太小（层少、神经元少）→ 欠拟合	表达力不够	加层、加神经元、换复杂模型
模型太大（参数远超样本量）→ 过拟合	容量过剩	减少层/神经元、加Dropout/正则化

记忆锚点：模型容量要和数据量匹配。

第3步：训练循环中

现象判断	原因	代码上怎么改
训练loss不下降 → 欠拟合	没学好	调大学习率、增加epoch、改优化器
训练loss下降、验证loss上升 → 过拟合	开始背题	早停、降低学习率、加正则化

记忆锚点：盯着训练和验证两条loss曲线。

第4步：评估与调优

现象判断	原因	代码上怎么改
训练好、验证差 → 过拟合	泛化差	上面第2、3步的方案
训练差、验证也差 → 欠拟合	没学会	上面第1、2步的方案

三、一张代码流程速查表（IDE旁边）

python 复制代码

# 1. 数据准备
if 训练差 and 验证差:        # 欠拟合
    → 加特征 / 特征交叉
if 训练好 and 验证差:        # 过拟合
    → 加数据 / 数据增强 / 清洗噪声

# 2. 模型定义
if 欠拟合:
    → 加层 / 加神经元 / 换大模型
if 过拟合:
    → 减层 / 减神经元 / 加Dropout / 加L2

# 3. 训练循环
欠拟合 → 增加epoch / 调大lr
过拟合 → 早停 / 降低lr / 加正则

# 4. 验证时
if 验证loss开始上升:
    触发早停      # 代码写Callback

四、一句话记忆（流程版）

先看数据（多少/好坏）→ 再看模型（大小/容量）→ 训练盯曲线（loss走势）→ 早停防过拟合，加epoch治欠拟合

写代码时按这个顺序检查一遍，比背分类表自然得多。