模型选择+过拟合欠拟合

临渊羡鱼的猫2024-12-31 8:50

训练误差和泛化误差

训练误差：模型在训练数据上的误差

泛化误差：模型在新数据上的误差

验证数据集：一个用来评估模型好坏的数据集

例如拿出50%的数据作为训练

测试数据集：只能用一次

K则交叉验证

在没有足够数据时使用

算法：

将训练数据分割为k块
for i in range(0, k]
- 使用第i块作为验证数据集，其余作为训练数据集
报告k个验证集误差的平均

训练数据集：训练模型参数

验证数据集：选择模型超参数

非大数据集上通常使用K折交叉验证

过拟合和欠拟合

根据数据集的复杂度选择模型容量

本质是泛化误差和训练误差的平衡

VC维可以衡量训练误差和泛化误差的间隔，但在深度学习中很少使用

SVM能解决的问题少于神经网络，神经网络可以通过卷积得到多种特征

上一篇：云手机：小红书矩阵搭建方案

下一篇：雷电模拟器安装LSPosed

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 0300 Debian字符界面如何支持中文 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结