模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
claude_dev4 分钟前
一步步搭建 Claude Code 的 MySQL MCP 服务器(附完整踩坑指南)
人工智能
liliangcsdn5 分钟前
V-trace的核心公式与计算过程
人工智能·机器学习
小哈里20 分钟前
【科研】ACM MM 论文 Latex 投稿模板修改(基于sample-sigconf-authordraft-v2.16)
人工智能·llm·科研·latex·cv·overleaf
优思学苑34 分钟前
过程能力指标CPK高为何现场仍不稳?
大数据·人工智能·管理·pdca·管理方法
AaronZZH35 分钟前
AG-UI:连接 AI 智能体与用户应用的开放协议
人工智能·ui
陈天伟教授1 小时前
人工智能应用- 人工智能交叉:05. 从 AlphaFold1 到 AlphaFold2
人工智能·神经网络·算法·机器学习·推荐算法
Eloudy1 小时前
CHI 开发备忘 03 记 -- CHI spec 03 网络层
人工智能·ai·arch·hpc
Together_CZ1 小时前
ViT-5: Vision Transformers for The Mid-2020s—— 面向2020年代中期的视觉Transformer
人工智能·深度学习·ai·transformer·vit·vit-5·面向2020年代中期的视觉
badfl1 小时前
Gemini 3.1 Pro更新内容一览:介绍、令牌限制、如何使用
人工智能·ai
大模型任我行1 小时前
北大:LLM数学证明形式化验证
人工智能·语言模型·自然语言处理·论文笔记