模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
DeniuHe3 分钟前
遗传算法中的轮盘赌选择法(Roulette Wheel Selection)
人工智能
星辰徐哥8 分钟前
表单优化:AI驱动HTML5表单的智能验证与提示功能
前端·人工智能·html5
这张生成的图像能检测吗13 分钟前
(论文速读)Shift:通过减少概念漂移解决时间序列预测泛化问题
人工智能·深度学习·transformer·时序模型
bzmK1DTbd22 分钟前
Java在人工智能:TensorFlow Java API的使用
java·人工智能·tensorflow
wangqiaowq26 分钟前
模型合并,转换,量化压缩,部署
人工智能·深度学习
Michaelwubo36 分钟前
openspec业务SDD驱动开发
人工智能·vibe code
GEO索引未来41 分钟前
大胆预测:国家会这样对GEO行业进行监管
大数据·人工智能·gpt·ai·chatgpt
闵孚龙42 分钟前
Prompt工程到底怎么做?从“会提问”到“能落地”的完整方法论
人工智能·prompt
AI人工智能+43 分钟前
文档抽取系统通过OCR与大语言模型融合技术,将非结构化文档(如合同、保单、表格)自动转换为结构化数据
人工智能·语言模型·ocr·文档抽取