李宏毅机器学习深度学习:机器学习任务攻略

课程概要

介绍了当我们遇到模型效果(loss)不理想时,进行模型优化的分析方法和思路。

Part 1> 原因分析

可能的原因:

  • 数据集标签不够(标签之间的因果关联性不强)

  • 模型简单(神经元层数不够)

  • 优化问题(optimization)

  • 训练过拟合 (ovefiting)

  • 训练集和测试集 统计学数据分布不匹配(mismatch)

判断方法

是不是训练集和测试集mismatch

训练集如果loss很低,但测试集loss高,则可以分析 训练集和测试集的区别

mismatch的情况示例:

e.g.1 用动物园的图像分类模型,识别野生动物

e.g.2 用亚洲人的特征识别模型,识别欧洲人的特征

是不是过拟合

训练集如果loss很低,但测试集loss高,且不太可能是mismatch的情况,说明很可能是过拟合

模型简单

加了神经元,没有优化效果:加了神经元,训练集和测试集的loss依然很高

则排除是模型简单的原因;

是不是optimization问题

不是上述两个,则可能是optimization

Part 2> 解决思路

应对overfiting:

方法一:增加/丰富数据集

  • 收集真实数据

  • 通过小样本扩增法(e.g. 图像左右反转、镜像等合理调整)

方法二:增加限制条件

  • 简化模型------减少参数

  • 减少关联性较少的标签(features)

  • 减少训练次数

  • 【预告】regularization数据归一化处理

  • 简化模型------减少少神经元(dropout)

  • 【预告】全连接网络、CNN部分讲

Part 3> 验证效果

通过公开数据集、私有数据集和自己的数据集中划分出的validtion set验证。

public数据集验证:

目的:公众说服力

示例:MINST手写数字

private数据集验证:

目的:公众说服力 / 领域内说服力。

示例:医患数据集(医患数据涉及病人隐私,常为非公开数据集)

validation数据集验证:

目的:证明神经网络/模型结构设计合理性、可解释性(逻辑自洽);也可以证明 泛用性(可迁移性)通用性

方法:validation 数据集划分(N-flod Cross法划分, "交叉验证"取平均值)

图为N-flod中N为3的示例。

相关推荐
水如烟4 小时前
孤能子视角:“组织行为学–组织文化“
人工智能
大山同学5 小时前
图片补全-Context Encoder
人工智能·机器学习·计算机视觉
薛定谔的猫19825 小时前
十七、用 GPT2 中文对联模型实现经典上联自动对下联:
人工智能·深度学习·gpt2·大模型 训练 调优
壮Sir不壮5 小时前
2026年奇点:Clawdbot引爆个人AI代理
人工智能·ai·大模型·claude·clawdbot·moltbot·openclaw
PaperRed ai写作降重助手5 小时前
高性价比 AI 论文写作软件推荐:2026 年预算友好型
人工智能·aigc·论文·写作·ai写作·智能降重
玉梅小洋5 小时前
Claude Code 从入门到精通(七):Sub Agent 与 Skill 终极PK
人工智能·ai·大模型·ai编程·claude·ai工具
-嘟囔着拯救世界-5 小时前
【保姆级教程】Win11 下从零部署 Claude Code:本地环境配置 + VSCode 可视化界面全流程指南
人工智能·vscode·ai·编辑器·html5·ai编程·claude code
正见TrueView5 小时前
程一笑的价值选择:AI金玉其外,“收割”老人败絮其中
人工智能
Imm7775 小时前
中国知名的车膜品牌推荐几家
人工智能·python
风静如云6 小时前
Claude Code:进入dash模式
人工智能