模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
未来之窗软件服务几秒前
一体化系统(九)高级表格自己编程如何选择——东方仙盟练气期
大数据·人工智能·仙盟创梦ide·东方仙盟·东方仙盟sdk·东方仙盟一体化·万象exce
学习是生活的调味剂2 分钟前
实战LLaMA2-7B指令微调
人工智能·alpaca
康实训5 分钟前
养老实训室建设
人工智能·机器学习·实训室·养老实训室·实训室建设
Code_流苏8 分钟前
GPT-5.1深度解析:更智能更自然,日常体验依旧出色!
人工智能·gpt·ai·深度解析·gpt5.1·日常体验
风吹稻香飘17 分钟前
【无标题】
人工智能·ai
Mintopia17 分钟前
🤖 AIGC技术对Web行业就业结构的影响:替代与新增岗位分析
人工智能·llm·aigc
wei_shuo23 分钟前
Mamba LLM 架构简介:机器学习的新范式
人工智能·机器学习·架构
CoovallyAIHub26 分钟前
告别“消失的小目标”:航拍图像检测新框架,精度飙升25.7%的秘诀
深度学习·算法·计算机视觉
keineahnung234526 分钟前
PyTorch動態形狀系統的基石 - SymNode
人工智能·pytorch·python·深度学习
Warren2Lynch40 分钟前
解锁 UML 潜力:Visual Paradigm AI 如何革新用例、活动图和顺序图的设计
人工智能·uml