模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
Soari5 分钟前
AI 编码智能体的“安全防弹衣”:深度拆解 agent-skills,构建百分百受信任的专业技能注册表
人工智能·网络安全·github·软件工程·aiagent·claudecode·agent-skills
陆星材7 分钟前
vs code 和 vs 2022接入 Claude Code
人工智能
han_12 分钟前
如何寻找、安装和管理 AI Skill?
人工智能·ai编程·claude
搬砖的梦先生15 分钟前
Codex Prompt 中“目标 + 约束”写法详解与操作指南
人工智能·microsoft·prompt
星浩AI18 分钟前
(三)一文看懂 Transformer:从 Token 到预测下一个字
人工智能·深度学习·llm
如去26 分钟前
第十篇《AI与环境保护:从“末端治理”到“全链条防控”的技术突围》
人工智能
1368木林森28 分钟前
RAG查询改写①【第九篇】:工业级Query全链路优化,抖音深度扩写生产方案
人工智能·rag
Agent产品评测局29 分钟前
本地化部署vs云端部署,制造业AI Agent方案对比:2026企业级自动化选型全景解析
运维·人工智能·ai·chatgpt·自动化
UXbot29 分钟前
评审前2小时完成页面布局:前端AI工具快速出图工作流
前端·人工智能·交互·产品经理·web app·ui设计
@蔓蔓喜欢你31 分钟前
React Server Components实战:提升首屏渲染性能
人工智能·ai