2022最新版-李宏毅机器学习深度学习课程-P23 为什么用了验证集结果还是过拟合

用了验证集还有可能会过拟合

这个片段可以从理论上证明这一点

以上整个挑选模型的过程也可以想象为一种训练。

把三个模型导出的最小损失公式看成一个集合,现在要做的就是在这个集合中找到某个h(此处可以视为训练),使得在验证集上的损失最低

当抽到不好的训练数据时,理想和现实会有差距。

训练数据不好的原因:

  • 训练资料的大小
  • 模型的复杂程度(越复杂,结果越糟的可能性越大)

当拿到的验证集不好时,理想和现实会有差距。

拿到的验证集不好的原因:

  • 验证集的大小
  • 这个模型的复杂程度(一般不会太大,比如说这里只有3个,取决于如何设计实验)
相关推荐
+wacyltd大模型备案算法备案16 分钟前
大模型备案怎么做?2025年企业大模型备案全流程与材料清单详解
人工智能·大模型备案·算法备案·大模型上线登记
吾在学习路31 分钟前
故事型总结:Swin Transformer 是如何打破 Vision Transformer 壁垒的?
人工智能·深度学习·transformer
sandwu42 分钟前
AI自动化测试(一)
人工智能·agent·playwright·ai自动化测试·midscene
问道飞鱼1 小时前
【人工智能】AI Agent 详解:定义、分类与典型案例
人工智能·ai agent
囊中之锥.1 小时前
《机器学习SVM从零到精通:图解最优超平面与软间隔实战》
算法·机器学习·支持向量机
光羽隹衡1 小时前
集成学习之随机森林
随机森林·机器学习·集成学习
编码小哥1 小时前
OpenCV形态学操作:腐蚀与膨胀原理解析
人工智能·opencv·计算机视觉
lbb 小魔仙1 小时前
AI + 云原生实战:K8s 部署分布式训练集群,效率翻倍
人工智能·云原生·kubernetes
啊巴矲1 小时前
小白从零开始勇闯人工智能:机器学习初级篇(随机森林)
人工智能·机器学习
技术小甜甜1 小时前
[AI Agent] 如何在本地部署 Aider 并接入局域网 Ollama 模型,实现本地智能助手操作系统资源
人工智能·ai·自动化·agent