模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
大信说财务9 分钟前
2026年数电票管理生态:技术路线、市场格局与选型策略
人工智能·自然语言处理·电子发票·智能化·发票管理·财务工具
Deepoch12 分钟前
Deepoc 开发板赋能工业巡检机器人自主感知与决策
人工智能·科技·机器人·巡检机器人·具身模型·deepoc
code 小楊19 分钟前
DeepSeek V4 全面解析:测评、对比、案例及实操指南
人工智能·开源
ZPC821021 分钟前
ROS2 速度远快于 UDP的完整方案(同机节点)
人工智能·算法·计算机视觉·机器人
AI袋鼠帝25 分钟前
Claude Design完整系统提示词泄露!
人工智能
AI袋鼠帝28 分钟前
阿里出手了,这次是"造世界"!
人工智能
大龄程序员狗哥29 分钟前
第22篇:生成对抗网络(GAN)入门——AI艺术创作的“造假”与“打假”(概念入门)
人工智能·神经网络·生成对抗网络
华清远见IT开放实验室32 分钟前
AI 算法核心知识清单(深度实战版2)
人工智能·深度学习·算法·机器学习·ai·模型训练
AI袋鼠帝32 分钟前
开源「仓颉.Skill」,你现在可以蒸馏任何书!
人工智能
阿杰学AI41 分钟前
AI核心知识137—大语言模型之 CLI与MCP(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·cli·mcp·模型上下文协议