2022最新版-李宏毅机器学习深度学习课程-P23 为什么用了验证集结果还是过拟合

用了验证集还有可能会过拟合

这个片段可以从理论上证明这一点

以上整个挑选模型的过程也可以想象为一种训练。

把三个模型导出的最小损失公式看成一个集合,现在要做的就是在这个集合中找到某个h(此处可以视为训练),使得在验证集上的损失最低

当抽到不好的训练数据时,理想和现实会有差距。

训练数据不好的原因:

  • 训练资料的大小
  • 模型的复杂程度(越复杂,结果越糟的可能性越大)

当拿到的验证集不好时,理想和现实会有差距。

拿到的验证集不好的原因:

  • 验证集的大小
  • 这个模型的复杂程度(一般不会太大,比如说这里只有3个,取决于如何设计实验)
相关推荐
喜欢吃豆6 分钟前
Parquet 范式:大语言模型训练数据格式优化的基础解析
人工智能·语言模型·自然语言处理·大模型·parquet
AI松子6667 分钟前
PyTorch-混合精度训练(amp)
人工智能·pytorch·python
MDLZH8 分钟前
Pytorch性能调优简单总结
人工智能·pytorch·python
GIS数据转换器1 小时前
基于GIS的智慧旅游调度指挥平台
运维·人工智能·物联网·无人机·旅游·1024程序员节
沧澜sincerely2 小时前
数据挖掘概述
人工智能·数据挖掘
数数科技的数据干货3 小时前
从爆款到厂牌:解读游戏工业化的业务持续增长道路
运维·数据库·人工智能
StarPrayers.4 小时前
K-means 聚类
机器学习·kmeans·聚类
amhjdx6 小时前
星巽短剧以科技赋能影视创新,构建全球短剧新生态!
人工智能·科技
听风南巷7 小时前
机器人全身控制WBC理论及零空间原理解析(数学原理解析版)
人工智能·数学建模·机器人
美林数据Tempodata7 小时前
“双新”指引,AI驱动:工业数智应用生产性实践创新
大数据·人工智能·物联网·实践中心建设·金基地建设