模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
喜欢吃豆1 分钟前
大语言模型混合专家(MoE)架构深度技术综述
人工智能·语言模型·架构·moe
老蒋新思维1 分钟前
创客匠人:当知识IP遇上系统化AI,变现效率如何实现阶跃式突破?
大数据·网络·人工智能·网络协议·tcp/ip·重构·创客匠人
有一个好名字4 分钟前
Spring AI 工具调用(Tool Calling):解锁智能应用新能力
java·人工智能·spring
Das14 分钟前
【计算机视觉】07_几何变换
人工智能·计算机视觉
却道天凉_好个秋6 分钟前
OpenCV(四十六):OBR特征检测
人工智能·opencv·计算机视觉
JosieBook8 分钟前
【大模型】用 AI Ping 免费体验 GLM-4.7 与 MiniMax M2.1:从配置到实战的完整教程
数据库·人工智能·redis
deephub12 分钟前
Anthropic 开源 Bloom:基于 LLM 的自动化行为评估框架
人工智能·python·自动化·大语言模型·行为评估
十铭忘13 分钟前
动作识别9——TSN训练实验
人工智能·深度学习·机器学习
小真zzz14 分钟前
当前集成Nano Banana Pro模型的AI PPT工具排名与分析
开发语言·人工智能·ai·powerpoint·ppt
galaxylove17 分钟前
Gartner预测2026年(二):驾驭中国的人工智能驱动变革
人工智能