pytorch计算网络参数量和Flops

python 复制代码
from torchsummary import summary
summary(net, input_size=(3, 256, 256), batch_size=-1)

输出的参数是除以一百万(/1000000)M,

python 复制代码
from fvcore.nn import FlopCountAnalysis
inputs = torch.randn(1, 3, 256, 256).cuda()
flop_counter = FlopCountAnalysis(net, inputs)
print(f"FLOPs: {flop_counter.total()}")

输出的参数是B,(/1024/1024/1024)G,(/1024/1024/1024/1024)T

相关推荐
Dongsheng_20194 分钟前
【泛3C篇】AI深度学习在手机背板外观缺陷检测应用方案
图像处理·人工智能·计算机视觉·视觉检测·边缘计算
AI360labs_atyun6 分钟前
AI教育开启新篇章
人工智能·百度·ai
成为深度学习高手30 分钟前
DGCN+informer分类预测模型
人工智能·分类·数据挖掘
Sunhen_Qiletian38 分钟前
卷积神经网络搭建实战(二)——基于PyTorch框架和本地自定义图像数据集的食物分类案例(附输入图片预测功能)
pytorch·分类·cnn
ouliten38 分钟前
cuda编程笔记(29)-- CUDA Graph
笔记·深度学习·cuda
minhuan40 分钟前
构建AI智能体:六十六、智能的边界:通过偏差-方差理论理解大模型的能力与局限
人工智能·方差·偏差·方差-偏差分解·方差-偏差权衡·模型调优
星期天要睡觉42 分钟前
深度学习——基于 ResNet18 的图像分类训练
pytorch·python·机器学习
润 下1 小时前
C语言——深入解析C语言指针:从基础到实践从入门到精通(四)
c语言·开发语言·人工智能·经验分享·笔记·程序人生·其他
koo3641 小时前
李宏毅机器学习笔记25
人工智能·笔记·机器学习
余俊晖1 小时前
如何让多模态大模型学会“自动思考”-R-4B训练框架核心设计与训练方法
人工智能·算法·机器学习