模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
源于花海2 分钟前
迁移学习简明手册——迁移学习相关研究学者
人工智能·机器学习·迁移学习·研究学者
OPEN-Source5 分钟前
开源工具轻松实现高清视频修复
人工智能·视频处理
EW Frontier5 分钟前
【ISAC+抗干扰+信号识别】5G ISAC+深度学习!破解智能交通“自干扰”难题,V2X通信准确率近100%【附代码】
人工智能·深度学习·5g·调制识别·抗干扰·isac
QUDONG_biubiubiu5 分钟前
DeepSeek推出OCR 2模型!瞄准高难度文档识别
人工智能·深度学习·deepseek·deepseek-ocr 2
szcsun56 分钟前
机器学习(四)--无监督学习
人工智能·学习·机器学习
.小墨迹8 分钟前
apollo中车辆的减速绕行,和加速超车实现
c++·学习·算法·ubuntu·机器学习
泰迪智能科技8 分钟前
师资培训分享丨大模型与智能体教学应用实战线下广州班莅临泰迪智能科技参观调研
人工智能·科技
小程故事多_8014 分钟前
RAG分块天花板?LGMGC多粒度语义分块策略深度解析与实践思考
人工智能·aigc
zhangfeng113324 分钟前
deepseek部署和训练的PyTorch CUDA Transformers Accelerate PEFT稳定版本呢推荐
人工智能·pytorch·python
2501_9479082025 分钟前
范建峰携手安盛投资 助力普惠金融惠及更多民生领域
大数据·人工智能·金融