【深度学习详解】Task3 实践方法论-分类任务实践 Datawhale X 李宏毅苹果书 AI夏令营

前言

综合之前的学习内容,

本篇将探究机器学习实践方法论

出现的问题及其原因

🍎 🍎 🍎

系列文章导航

【深度学习详解】Task1 机器学习基础-线性模型 Datawhale X 李宏毅苹果书 AI夏令营
【深度学习详解】Task2 分段线性模型-引入深度学习 Datawhale X 李宏毅苹果书 AI夏令营
【深度学习详解】Task3 实践方法论-分类任务实践 Datawhale X 李宏毅苹果书 AI夏令营

本篇目录导航

实践方法论


本篇笔记 General Guide 从原视频课件进行修改:
李宏毅《机器学习/深度学习》2021课程 -> 机器学习任务攻略

问题描述:large loss on training data

训练数据的损失很大,显然它在训练集上面也没有训练好

模型偏差

鼠标右键 -> 在新标签页中打开图像

原因分析 模型过于简单

  • 该函数的集合太小了, 没有包含任何一个函数,
    可以让损失变低的函数不在模型可以描述的范围内。

  • 想要在大海里面捞针(一个损失低的函数),
    结果针根本就不在海里。
    解决方案 给模型更大的灵活性

  • 增加输入的特征,即同时考虑更多训练数据
    (得到更有灵活性 flexibility 的函数)

  • 重新设计一个模型,使用深度学习
    (更多的 layer 层数)

优化问题

鼠标右键 -> 在新标签页中打开图像

原因分析 优化器不给力

  • 优化器(梯度下降)在寻找代价函数最低点的过程,
    会出现局部最小值干扰,无法找到全局最小值。
  • 想要在大海里面捞针(一个损失低的函数),
    针确实在海里,但是无法把针捞起来。

    解决方案 尝试更强大的优化器,寻找损失低的函数

is 模型偏差 or 优化问题 ?

判断是 模型偏差 or 优化问题 ?

问题描述:large loss on testing data

训练数据上面的损失小,但在测试数据上的损失大

过拟合【交叉验证】

鼠标右键 -> 在新标签页中打开图像

原因分析 模型过于复杂

  • 模型灵活性过大,学习到了训练数据的噪声。
    (模型过于复杂,对数据过度适应)

    解决方案 增加训练集数据限制住拟合的模型
    (往往是最有效的方向)

  • 需要增加额外的训练集数据(不容易。)

  • 不用增加额外的训练集数据(很建议!)
    data augmentation 数据增强:
    根据问题的理解创造出新的合理数据

给模型更多的限制性

  • 减少输入的特征,即同时考虑更少训练数据
    (不要过大灵活性 flexibility 的函数)
  • 重新设计一个模型:减少参数 / 共用参数(可以让一些参数有一样的数值)
    eg. 神经元数量
  • 重新设计一个模型:使用更受限的模型。
    eg. 卷积神经网络(Convolutional Neural Network,CNN)
    是比全连接网络(fully-connected network)更有限制的架构
  • Early stopping 早停
  • Regularization 正则化
  • Dropout 丢弃法

trade-off(权衡模型的灵活性和限制性)

比较合理选择模型的方法是:

将训练数据分成"训练集"和"进行模型选择的验证集"

即,

在训练集上训练出来的模型

会使用验证集来衡量分数和挑选模型,即基线(baseline)算法

(避免在公开的测试集上面频繁挑选模型导致的过拟合)

  • Cross Validation 交叉验证

    将训练数据按照百分比随机分成"训练集"和"进行模型选择的验证集"。例如:

    90%训练数据作为"训练集",

    10%训练数据作为"进行模型选择的验证集"。

  • N-fold Cross Validation N 折交叉验证

    将训练数据切成 n 等份,这件事情要重复 3 次:

    n - 1 份作为"训练集",

    还有 1 份作为"进行模型选择的验证集"。

不匹配

鼠标右键 -> 在新标签页中打开图像

原因分析 **训练集和测试集的分布不同,

导致模型在测试集上的预测表现不佳。**


解决方案 要对训练数据和测试数据的产生方式有一些理解,
确保重新收集的训练数据与数据数据的分布尽可能一致


Python 分类任务实践

baseline 教程
https://datawhaler.feishu.cn/wiki/M7tqwIHYdiz5ULkRkD9cPPWTntg
数据集 下载

【2023机器学习】的系列资料包括 视频、课件、代码等资源已经系统顺序命名并整理到百度网盘:
https://pan.baidu.com/s/1-zfs0wn5rccTRVk34YZWaA,提取码:2023。
来源:https://blog.csdn.net/qq_39975984/article/details/133103314


Read more

相关推荐
ZKNOW甄知科技3 分钟前
数智同行:甄知科技2026年Q1季度回顾
运维·服务器·人工智能·科技·程序人生·安全·自动化
呆呆敲代码的小Y4 分钟前
【Unity工具篇】| 游戏完整资源热更新流程,YooAsset官方示例项目
人工智能·游戏·unity·游戏引擎·热更新·yooasset·免费游戏
jikemaoshiyanshi5 分钟前
B2B企业GEO服务商哪家好?深度解析径硕科技(JINGdigital)及其JINGEO产品为何是首选
大数据·运维·人工智能·科技
Lab_AI5 分钟前
浩天药业携手创腾科技,开启研发数字化新篇章!电子实验记录本(ELN)落地浩天药业
人工智能
supericeice7 分钟前
大模型建筑隐患管理方案怎么做?创邻科技用知识图谱、图数据库和企业AI大脑打通隐患问答、整改与推荐
人工智能·科技·知识图谱
蕤葳-10 分钟前
非编程背景学习AI的方法
人工智能
handsomestWei12 分钟前
scikit-learn数据预处理模块
python·机器学习·scikit-learn
北京耐用通信13 分钟前
不换设备、不重写程序:耐达讯自动化网关如何实现CC-Link IE转Modbus TCP的高效互通?
人工智能·科技·物联网·网络协议·自动化·信息与通信
计算机毕业设计指导14 分钟前
基于机器学习和深度学习的恶意WebURL检测系统实战详解
人工智能·深度学习·机器学习·网络安全
珂朵莉MM15 分钟前
第七届全球校园人工智能算法精英大赛-算法巅峰赛产业命题赛第3赛季优化题--多策略混合算法
人工智能·算法