2022最新版-李宏毅机器学习深度学习课程-P23 为什么用了验证集结果还是过拟合

用了验证集还有可能会过拟合

这个片段可以从理论上证明这一点

以上整个挑选模型的过程也可以想象为一种训练。

把三个模型导出的最小损失公式看成一个集合,现在要做的就是在这个集合中找到某个h(此处可以视为训练),使得在验证集上的损失最低

当抽到不好的训练数据时,理想和现实会有差距。

训练数据不好的原因:

  • 训练资料的大小
  • 模型的复杂程度(越复杂,结果越糟的可能性越大)

当拿到的验证集不好时,理想和现实会有差距。

拿到的验证集不好的原因:

  • 验证集的大小
  • 这个模型的复杂程度(一般不会太大,比如说这里只有3个,取决于如何设计实验)
相关推荐
tianyunlinger14 分钟前
rope编码代码分享
pytorch·python·深度学习
如生命般费解的谜团1 小时前
LLM学习笔记(7)Scaled Dot-product Attention
人工智能·笔记·学习·语言模型·json
IT古董2 小时前
【机器学习】如何使用Python的Scikit-learn库实现机器学习模型,并对数据进行预处理和特征缩放以提高模型性能?
python·机器学习·scikit-learn
FreeIPCC3 小时前
电话机器人是什么?
大数据·人工智能·语言模型·机器人·开源·信息与通信
醉酒柴柴3 小时前
【代码pycharm】动手学深度学习v2-08 线性回归 + 基础优化算法
深度学习·算法·pycharm
至善迎风3 小时前
施密特正交化与单位化的情形
线性代数·算法·决策树·机器学习
字节数据平台3 小时前
火山引擎数据飞轮探索零售企业大促新场景:下放营销活动权限
大数据·人工智能
啊啊啊六子4 小时前
windows下安装wsl的ubuntu,同时配置深度学习环境
windows·深度学习·ubuntu
努力学习的啊张4 小时前
消息称三星正与 OpenAI 洽谈,有望令 Galaxy AI 整合ChatGPT,三星都要和chatgpt合作了,你会使用chatgpt了吗?
人工智能·chatgpt
Together_CZ4 小时前
GPT-4 Technical Report——GPT-4技术报告
人工智能·gpt-4