深度学习记录--偏差/方差(bias/variance)

误差问题

拟合神经网络函数过程中会出现两种误差:偏差 (bias )和方差 (variance)

偏差和误差的区别

欠拟合(underfitting)

当偏差(bias)过大时,如左图,拟合图像存在部分不符合值,称为欠拟合(underfitting)

过拟合(overfitting)

当方差(variance)过大时,如右图,拟合图像过于特殊,不够集中(即方差过大),称为过拟合(overfitting)

误差和train/dev sets

以猫的识别为例:

基本误差/最优误差很小 时,且train/dev sets来自同一分布,则会有以下判断:

train set error较小,dev set error过大:high variance

train set error过大,dev set error过大(与train set error差不多):high bias

train set error过大,dev set error过大(比train set error还大很多):high bias & high variance

train set error较小,dev set error较小:low bias & low variance

假如基本误差不是很小,则要考虑error与基本误差之间的大小差距来进行恰当的判断

训练神经网络的基本方法

high bias

--> bigger network(更深的神经网络模型)

--> train longer(训练更长时间,让模型更加成熟)
high variance

-->more data(更大的数据量,更加具有普遍性)

-->regularization(正则化)

相关推荐
cxr828几秒前
从多目标定义到闭环实验验证的系统工程
人工智能·智能体·逆向合成·材料设计合成
刀法如飞6 分钟前
Rust数组去重的20种实现方式,AI时代用不同思路解决问题
人工智能·算法·ai编程
code_pgf7 分钟前
OpenClaw的tools与skills详解
人工智能
user80395279525438 分钟前
Codex 新人上手——从需求到上线的完整工作流
人工智能
阿斯加德D19 分钟前
《霍格沃茨之遗》风灵月影修改器下载(已汉化)2026最新版
人工智能·测试工具·游戏·3d·游戏程序
HIT_Weston24 分钟前
75、【Agent】【OpenCode】用户对话提示词(question 工具)
人工智能·agent·opencode
weikecms28 分钟前
外卖霸王餐API接口对接
大数据·人工智能·企业微信·微客云
zhangfeng113333 分钟前
带有embeding 同时训练的Lora 权重合并,合并后的权重的模型,再训练数的Loss 突然增加
人工智能·lora·sft
树獭非懒37 分钟前
Claude Code 完全入门指南:让你的 AI 从"会说"到"会做"
人工智能·程序员·llm
数智工坊38 分钟前
基于CLIP隐空间的层级文本条件图像生成:unCLIP核心原理与全链路解析
论文阅读·人工智能·深度学习·transformer·迁移学习