模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
yzx99101314 小时前
人工智能编程指南:OpenAI Codex 完全使用手册
人工智能
DreamLife☼14 小时前
OpenBCI-实时BCI系统:低延迟与闭环控制
人工智能·信息可视化·信号处理·开源硬件·脑机接口·低延迟·openbci
Nile14 小时前
解密Palantir系列二:4.Palantir Foundry:七问判断该不该上
人工智能·ai·agent·ai编程·ai-native
林间码客14 小时前
03数据挖掘:分类(Classification)
人工智能·分类·数据挖掘
福老板的生意经14 小时前
降本增效!全域智能投放方案如何破解营销投放低效难题
大数据·人工智能
CJH(本人账号)14 小时前
上线仅72小时被强制下架:Claude Fable 5 的短命
人工智能·安全·语言模型
AI产品库14 小时前
小米MiMo技术团队正式发布并开源终端原生AI编程助手 MiMo Code,标志着小米首次进入Coding Agent赛道
人工智能·开源·ai编程
城事漫游Molly14 小时前
“改全文”还是“逐句诊断”?ChatGPT 润色论文的两种用法
人工智能·chatgpt·提示词·ai for science·论文润色·科研论文写作
一头老黄牛@14 小时前
飞书 × OpenClaw 接入指南:不用服务器,用长连接把机器人跑起来
数据结构·人工智能·程序人生·算法·决策树·自动化·推荐算法
A.说学逗唱的Coke14 小时前
【大模型专题】AI Copilot 完整实践指南:VSCode + GitHub Copilot Agent 模式全攻略
人工智能·vscode·copilot