模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
小程故事多_8015 分钟前
自然语言智能体控制框架,重塑AI Agent的协作与执行范式
人工智能·架构·aigc·ai编程·harness
2501_9333295520 分钟前
技术深度拆解:Infoseek舆情系统的全链路架构与核心实现
开发语言·人工智能·分布式·架构
aosky27 分钟前
OmniVoice:支持 600+ 语言的零样本语音克隆 TTS 系统
人工智能·tts
无忧智库37 分钟前
数字化转型 | 全面揭秘企业经营的数字化解决方案 —— 从挑战到突破
大数据·人工智能
Circle Studio1 小时前
AI算力发展的未来趋势
大数据·人工智能
算家云1 小时前
OpenClaw进阶玩法:多飞书机器人部署指南
人工智能·飞书·openclaw
AI_Auto1 小时前
【智能制造】- AI质检+MES:重构智能制造质量闭环
人工智能·重构·制造
Wild API1 小时前
Claude 和 GPT 可以怎么搭?一个多模型调用示例讲清楚
人工智能·gpt
科研实践课堂(小绿书)1 小时前
华科/浙大团队Science子刊:光计算抛弃模拟乘法,用逻辑门跑神经网络
人工智能·深度学习·神经网络
rainy雨1 小时前
精益数据分析系统功能拆解:如何用精益数据分析解决指标虚高难题与初创期验证场景
大数据·数据库·人工智能·信息可视化·数据挖掘·数据分析·精益工程