2022最新版-李宏毅机器学习深度学习课程-P23 为什么用了验证集结果还是过拟合

用了验证集还有可能会过拟合

这个片段可以从理论上证明这一点

以上整个挑选模型的过程也可以想象为一种训练。

把三个模型导出的最小损失公式看成一个集合,现在要做的就是在这个集合中找到某个h(此处可以视为训练),使得在验证集上的损失最低

当抽到不好的训练数据时,理想和现实会有差距。

训练数据不好的原因:

  • 训练资料的大小
  • 模型的复杂程度(越复杂,结果越糟的可能性越大)

当拿到的验证集不好时,理想和现实会有差距。

拿到的验证集不好的原因:

  • 验证集的大小
  • 这个模型的复杂程度(一般不会太大,比如说这里只有3个,取决于如何设计实验)
相关推荐
nancy_princess5 小时前
clip实验
人工智能·深度学习
飞哥数智坊5 小时前
TRAE Friends@济南第4次活动:100+极客集结,2小时极限编程燃爆全场!
人工智能
AI自动化工坊5 小时前
ProofShot实战:给AI编码助手添加可视化验证,提升前端开发效率3倍
人工智能·ai·开源·github
飞哥数智坊5 小时前
一场直播涨粉 2 万的背后!OpenClaw + 飞书,正在重塑软件交付的方式
人工智能
飞哥数智坊5 小时前
养虾记第3期:安装、调教、落地,这场沙龙我们全聊了
人工智能
再不会python就不礼貌了5 小时前
从工具到个人助理——AI Agent的原理、演进与安全风险
人工智能·安全·ai·大模型·transformer·ai编程
AI医影跨模态组学5 小时前
Radiother Oncol 空军军医大学西京医院等团队:基于纵向CT的亚区域放射组学列线图预测食管鳞状细胞癌根治性放化疗后局部无复发生存期
人工智能·深度学习·医学影像·影像组学
A尘埃5 小时前
神经网络的激活函数+损失函数
人工智能·深度学习·神经网络·激活函数
没有不重的名么6 小时前
Pytorch深度学习快速入门教程
人工智能·pytorch·深度学习
有为少年6 小时前
告别“唯语料论”:用合成抽象数据为大模型开智
人工智能·深度学习·神经网络·算法·机器学习·大模型·预训练