深度学习记录--偏差/方差(bias/variance)

误差问题

拟合神经网络函数过程中会出现两种误差:偏差 (bias )和方差 (variance)

偏差和误差的区别

欠拟合(underfitting)

当偏差(bias)过大时,如左图,拟合图像存在部分不符合值,称为欠拟合(underfitting)

过拟合(overfitting)

当方差(variance)过大时,如右图,拟合图像过于特殊,不够集中(即方差过大),称为过拟合(overfitting)

误差和train/dev sets

以猫的识别为例:

基本误差/最优误差很小 时,且train/dev sets来自同一分布,则会有以下判断:

train set error较小,dev set error过大:high variance

train set error过大,dev set error过大(与train set error差不多):high bias

train set error过大,dev set error过大(比train set error还大很多):high bias & high variance

train set error较小,dev set error较小:low bias & low variance

假如基本误差不是很小,则要考虑error与基本误差之间的大小差距来进行恰当的判断

训练神经网络的基本方法

high bias

--> bigger network(更深的神经网络模型)

--> train longer(训练更长时间,让模型更加成熟)
high variance

-->more data(更大的数据量,更加具有普遍性)

-->regularization(正则化)

相关推荐
Niuguangshuo2 小时前
深入解析Stable Diffusion基石——潜在扩散模型(LDMs)
人工智能·计算机视觉·stable diffusion
迈火2 小时前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
wfeqhfxz25887822 小时前
YOLO13-C3k2-GhostDynamicConv烟雾检测算法实现与优化
人工智能·算法·计算机视觉
芝士爱知识a3 小时前
2026年AI面试软件推荐
人工智能·面试·职场和发展·大模型·ai教育·考公·智蛙面试
Li emily3 小时前
解决港股实时行情数据 API 接入难题
人工智能·python·fastapi
Aaron15883 小时前
基于RFSOC的数字射频存储技术应用分析
c语言·人工智能·驱动开发·算法·fpga开发·硬件工程·信号处理
J_Xiong01173 小时前
【Agents篇】04:Agent 的推理能力——思维链与自我反思
人工智能·ai agent·推理
星爷AG I3 小时前
9-26 主动视觉(AGI基础理论)
人工智能·计算机视觉·agi
爱吃泡芙的小白白4 小时前
CNN参数量计算全解析:从基础公式到前沿优化
人工智能·神经网络·cnn·参数量
拐爷4 小时前
vibe‑coding 九阳神功之喂:把链接喂成“本地知识”,AI 才能稳定干活(API / 设计 / 报道 / 截图)
人工智能