模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
九酒3 小时前
AI Agent 开发踩坑记:口播功能非得用 APP 原生实现吗?
前端·人工智能·agent
蝎子莱莱爱打怪3 小时前
DSpark 讲透:DeepSeek 不换模型,硬把 V4 提速 85%,是怎么做到的?
人工智能·面试·程序员
巫山老妖5 小时前
置身AI内
人工智能
IT_陈寒6 小时前
JavaScript项目实战经验分享
前端·人工智能·后端
vanuan7 小时前
两个AI智能体第一次对话-A2A双Agent协作实战
人工智能
kfaino9 小时前
码农的AI翻身(四)你好,我叫 Attention
人工智能·后端
雨落Re11 小时前
如何设计一个高质量Skill
人工智能
Token炼金师12 小时前
大模型权重文件全指南:从格式选择到优化实战
人工智能
阿牛哥_GX12 小时前
CDP 浏览器操控原理:让脚本接管你的浏览器
人工智能
ThreeS12 小时前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路
人工智能·python