2022最新版-李宏毅机器学习深度学习课程-P23 为什么用了验证集结果还是过拟合

用了验证集还有可能会过拟合

这个片段可以从理论上证明这一点

以上整个挑选模型的过程也可以想象为一种训练。

把三个模型导出的最小损失公式看成一个集合,现在要做的就是在这个集合中找到某个h(此处可以视为训练),使得在验证集上的损失最低

当抽到不好的训练数据时,理想和现实会有差距。

训练数据不好的原因:

  • 训练资料的大小
  • 模型的复杂程度(越复杂,结果越糟的可能性越大)

当拿到的验证集不好时,理想和现实会有差距。

拿到的验证集不好的原因:

  • 验证集的大小
  • 这个模型的复杂程度(一般不会太大,比如说这里只有3个,取决于如何设计实验)
相关推荐
AI_Auto7 小时前
智能制造 - 人工智能、隐私保护、信息安全
人工智能·制造
yLDeveloper7 小时前
一只菜鸟学深度学习的日记:入门卷积
机器学习·dive into deep learning
一只乔哇噻7 小时前
java后端工程师+AI大模型开发进修ing(研一版‖day60)
java·开发语言·人工智能·学习·语言模型
千里码aicood7 小时前
计算机大数据、人工智能与智能系统开发定制开发
大数据·人工智能·深度学习·决策树·机器学习·森林树
币圈菜头7 小时前
【空投速递】GAEA项目解析:首个集成人类情感数据的去中心化AI训练网络
人工智能·web3·去中心化·区块链
Dcs8 小时前
你的 Prompt 都该重写?
人工智能·ai编程
木卫二号Coding8 小时前
第五十三篇-Ollama+V100+Qwen3:4B-性能
人工智能
飞哥数智坊8 小时前
AI 不只是聊天:聊聊我最近在做的新方向
人工智能
学生高德9 小时前
小模型结合大模型的加速方法关键笔记
人工智能·深度学习·机器学习
蓝耘智算9 小时前
GPU算力租赁与算力云平台选型指南:从需求匹配到成本优化的实战思路
大数据·人工智能·ai·gpu算力·蓝耘