模型选择+过拟合欠拟合

训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

验证数据集:一个用来评估模型好坏的数据集

  • 例如拿出50%的数据作为训练

测试数据集:只能用一次

K则交叉验证

在没有足够数据时使用

算法:

  • 将训练数据分割为k块
  • for i in range(0, k]
    • 使用第i块作为验证数据集,其余作为训练数据集
  • 报告k个验证集误差的平均

训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔,但在深度学习中很少使用

SVM能解决的问题少于神经网络,神经网络可以通过卷积得到多种特征

相关推荐
云边云科技_云网融合6 小时前
AI 网关:企业 AI 时代的 “智能交通枢纽“—— 六大行业典型场景深度解析
大数据·运维·人工智能
GISer_Jing6 小时前
Claude Code MCP Server 集成全解析
前端·人工智能·ai·架构
qcx236 小时前
【系统学AI】21 AI产品定位:April Dunford方法在AI红海中的应用
人工智能·claude·cursor·定价·ai native
Good kid.6 小时前
不用自建代理,国内直连 Gemini API:Aisoui 接入指南与定价说明
人工智能·ai·gemini
AmberSoulAnswersAI占星6 小时前
# 为什么AI本命盘报告很难做好——Soul Answers的解题思路
人工智能
jkyy20146 小时前
AI赋能业态革新,助力大健康新零售开启智能化新赛道
人工智能·零售
阿瑞IT6 小时前
AI Agent 从 Demo 到生产:被低估的四个工程问题
人工智能
小锋java12346 小时前
【技术专题】LangChain4j 开发Java Agent智能体 - 整合SpringBoot4
java·人工智能
MemOS6 小时前
产品更新 |MemOS CLI 上线:让能跑命令行的 Agent 更轻量接入长期记忆
人工智能
独秀不如众秀6 小时前
AI Coding 的最大问题不是写错代码,而是反复犯同一个错
人工智能