深度学习记录--偏差/方差(bias/variance)

误差问题

拟合神经网络函数过程中会出现两种误差:偏差 (bias )和方差 (variance)

偏差和误差的区别

欠拟合(underfitting)

当偏差(bias)过大时,如左图,拟合图像存在部分不符合值,称为欠拟合(underfitting)

过拟合(overfitting)

当方差(variance)过大时,如右图,拟合图像过于特殊,不够集中(即方差过大),称为过拟合(overfitting)

误差和train/dev sets

以猫的识别为例:

基本误差/最优误差很小 时,且train/dev sets来自同一分布,则会有以下判断:

train set error较小,dev set error过大:high variance

train set error过大,dev set error过大(与train set error差不多):high bias

train set error过大,dev set error过大(比train set error还大很多):high bias & high variance

train set error较小,dev set error较小:low bias & low variance

假如基本误差不是很小,则要考虑error与基本误差之间的大小差距来进行恰当的判断

训练神经网络的基本方法

high bias

--> bigger network(更深的神经网络模型)

--> train longer(训练更长时间,让模型更加成熟)
high variance

-->more data(更大的数据量,更加具有普遍性)

-->regularization(正则化)

相关推荐
qq_12498707532 分钟前
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计
杜子不疼.2 分钟前
CANN算子基础框架库opbase的算子开发与扩展机制深度解析
人工智能
程序猿追3 分钟前
CANN ops-math仓库解读 数学算子的底层支撑与高性能实现
人工智能·架构
结局无敌3 分钟前
统一算子语言:cann/ops-nn 如何为异构AI世界建立通用“方言”
人工智能·cann
杜子不疼.10 分钟前
CANN计算机视觉算子库ops-cv的图像处理与特征提取优化实践
图像处理·人工智能·计算机视觉
大闲在人11 分钟前
软件仍将存在,但软件公司会以全新形式出现——从Claude智能体引发万亿市值震荡看行业重构
人工智能
艾莉丝努力练剑12 分钟前
【Linux:文件】Ext系列文件系统(初阶)
大数据·linux·运维·服务器·c++·人工智能·算法
芷栀夏16 分钟前
从 CANN 开源项目看现代爬虫架构的演进:轻量、智能与统一
人工智能·爬虫·架构·开源·cann
梦帮科技25 分钟前
OpenClaw 桥接调用 Windows MCP:打造你的 AI 桌面自动化助手
人工智能·windows·自动化
User_芊芊君子29 分钟前
【分布式训练】CANN SHMEM跨设备内存通信库:构建高效多机多卡训练的关键组件
分布式·深度学习·神经网络·wpf