模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
闵孚龙5 分钟前
Tensor:PyTorch 世界里的一切都是张量
人工智能·pytorch·python
GPT-Image25 分钟前
AI把世界杯“提前踢开幕”了
人工智能·chatgpt·ai作画·aigc
Sam09276 分钟前
Java 转 AI Agent 开发:Java 和 Python 的区别与快速学习指南
java·人工智能·python·ai
从负无穷开始的三次元代码生活12 分钟前
AI基座知识点——了解AI核心组件内容部分
人工智能·ai
林间码客12 分钟前
人工智能知识点复习汇总
人工智能
wilbertzhou12 分钟前
大语言模型时代的语义元数据:从静态资产目录到智能治理
人工智能·llm·大语言模型·数据治理·元数据管理·语义元数据
皮皮蟹虾饺14 分钟前
MiniMind:从零训练大语言模型全流程实战指南
人工智能·语言模型·自然语言处理
万俟淋曦14 分钟前
【论文速递】2026年第03周(Jan-11-17)(Robotics/Embodied AI/LLM)
人工智能·ai·机器人·大模型·论文·robotics·具身智能
邵宇然14 分钟前
静态图编译优化:基于 Rust 的计算图常量折叠与无效节点剪枝
人工智能
腾讯云开发者17 分钟前
从单体 Agent 到群体智能:OpenClaw 背后的分布式 AI 演进
人工智能