深度学习知识点总结

关于bn层

mean,std 第i个元素就是第i个通道上全部batch张输出特征图所有元素的平均值和方差,所shape就是特征图shape
可学习参数 weight和bias分别对应 γ,β.有bn时cov可以不用bia

在训练过程中,mean和std是统计得到的,然后在迭代过程中动态累加,m*si-1+(1-m)*si,m为历史保留比,对应pytorch的momenta参数,test过程中使用训练过程的统计结果

关于计算量(FLOPs)和参数量(Params)

flops :乘加次数,计算量对应时间复杂度

例如:
f l o p s c o v = h ∗ w ∗ k 2 ∗ c i n ∗ c o u t f l o p s d o w n s a m p l e = 0 f l o p s f c = w e i g h t i n ∗ w e i g h t o u t flops_{cov} = h*w*k^2*c_{in}*c_{out}\newline flops_{downsample} = 0\newline flops_{fc} = weight_{in}*weight_{out} flopscov=h∗w∗k2∗cin∗coutflopsdownsample=0flopsfc=weightin∗weightout
params :参数量对应于我们之前的空间复杂度,参数量影响显存
p a r a m s c o v = k 2 ∗ c i n ∗ c o u t p a r a m s d o w n s a m p l e = 0 p a r a m s f c = w e i g h t i n ∗ w e i g h t o u t params_{cov} = k^2*c_{in}*c_{out}\newline params_{downsample} = 0\newline params_{fc} = weight_{in}*weight_{out} paramscov=k2∗cin∗coutparamsdownsample=0paramsfc=weightin∗weightout
显存=模型自身的参数(params)+模型计算产生的中间变量(memory)

相关推荐
galaxylove几秒前
Gartner预测2026年(二):驾驭中国的人工智能驱动变革
人工智能
GISer_Jing几秒前
JD AI全景:未来三年带动形成万亿规模的人工智能生态
前端·人工智能·aigc
liulanba4 分钟前
机器学习评估指标详解 - 高级篇
人工智能·机器学习
许泽宇的技术分享5 分钟前
当AI Agent学会“打电话“——微软Agent Framework的A2A与AGUI协议深度解析
人工智能·microsoft·a2a协议·ai多智能体·agui
Qt学视觉8 分钟前
PaddlePaddle-2wget下载安装
c++·人工智能·paddlepaddle
雪花desu9 分钟前
大模型应用评估—— 从 BLEU 到 Agent 综合评价
人工智能·深度学习·神经网络·语言模型
CS创新实验室13 分钟前
课程提纲:计算机视觉——从原理解析到产业落地
人工智能·计算机视觉·cv
EchoL、26 分钟前
【论文阅读】SteganoGAN:High Capacity Image Steganography with GANs
论文阅读·人工智能·笔记·算法
元智启27 分钟前
企业AI智能体:技术突破与生态融合重构产业新格局——从单点突破到系统重构的产业跃迁
人工智能·重构
CoovallyAIHub27 分钟前
深度学习驱动的视频异常检测(VAD),AI如何让监控更智能?
深度学习·算法·计算机视觉