吴恩达深度学习课程三: 结构化机器学习项目 第一周:机器学习策略(二)数据集设置

此分类用于记录吴恩达深度学习课程的学习笔记。

课程相关信息链接如下:

  1. 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai
  2. github课程资料,含课件与笔记:吴恩达深度学习教学资料
  3. 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案

本篇为第三课的第一周内容,1.51.7的内容。


本周为第三课的第一周内容,本周的内容关于在实际项目进行中的一些基本策略,并不涉及技术性的知识。

经过整个第一课和第二课后, 我们已经了解了足够支持我们构建一个完整的基础神经网络项目的知识和技术,本周便是在这些基础上的一个指导策略,可以帮助实现更好确定项目方向,优化和评估模型性能。

只要对前面两课涉及的技术原理足够了解,可以说,本周的内容不存在理解上的难度。

本篇的内容关于数据集设置 ,有很大一部分内容在之前已经提到过,所以篇幅会较短一些,并且我会在重复的部分进行标注。

1. 数据集划分经验(重复)

实际上,在之前的偏差与方差部分我们已经了解过这方面的内容,只是在本周的范畴里,课程中再次强调了这一段,为了每一篇的逻辑完整一些,我们也简单重复一下,就不占用太多篇幅了。

2.确保测试集和训练集来自同一分布(重复)

3.何时更改验证集和指标?

这部分是这几节课程里新补充的内容,课程里把验证集,测试集和指标的设置比作画靶子,也就是任务的目标。

简单举个例子,就像上面说的,如果我们使用类似用户上传的模糊照作为验证集 ,以此不断调优拟合,那说明我们的目标就是实现用户上传的模糊图像的正确分类。

再比如,如果是某种要求分辨可疑人员的模型 ,在上一篇提及的评估指标中,如果使用单一评估指标,那么我们其实更倾向于使用召回率,因为这个任务的性质更偏向于"宁杀错,不放过"。

现在,转换一下这个标题:何时更改验证集和指标?其实是在说:什么现象让我们发现自己的设置和目标不匹配?

这才是课程里讲述的内容,我们来展开课程里的一个例子(这部分弹幕骤增):

因此,在这个例子中,真实应用发现指标的设置不能正确反应任务要求 ,因此,我们需要修改指标。

还有就是我们一直说的"高清猫"和"模糊猫"的问题,在那种情景下,真实应用发现验证集,测试集不能正确实现任务目标,因此,我们需要修改验证集和测试集。

这就是本篇的内容,几乎没有理解上的难度。下一篇就是本周内容的最后一篇,通过比较模型性能和人的表现讨论模型优化的方向和空间,也有一些新的概念。

相关推荐
梁辰兴13 分钟前
百亿美元赌注变数,AI军备竞赛迎来转折点?
人工智能·ai·大模型·openai·英伟达·梁辰兴·ai军备竞赛
龙山云仓18 分钟前
No140:AI世间故事-对话康德——先验哲学与AI理性:范畴、道德律与自主性
大数据·人工智能·深度学习·机器学习·全文检索·lucene
Anarkh_Lee1 小时前
【小白也能实现智能问数智能体】使用开源的universal-db-mcp在coze中实现问数 AskDB智能体
数据库·人工智能·ai·开源·ai编程
jay神2 小时前
基于YOLOv8的木材表面缺陷检测系统
人工智能·深度学习·yolo·计算机视觉·毕业设计
songyuc2 小时前
【Llava】load_pretrained_model() 说明
人工智能·深度学习
名为沙丁鱼的猫7292 小时前
【MCP 协议层(Protocol layer)详解】:深入分析MCP Python SDK中协议层的实现机制
人工智能·深度学习·神经网络·机器学习·自然语言处理·nlp
ahxdyz3 小时前
.NET平台MCP
ai·.net·mcp
小Tomkk4 小时前
PyTorch +YOLO + Label Studio + 图像识别 深度学习项目实战 (二)
pytorch·深度学习·yolo
龙腾亚太4 小时前
航空零部件加工变形难题破解:数字孪生 + 深度学习的精度控制实战
人工智能·深度学习·数字孪生·ai工程师·ai证书·转型ai
Coding茶水间4 小时前
基于深度学习的输电电力设备检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
开发语言·人工智能·深度学习·yolo·目标检测·机器学习