深度学习代码片段收集

python 复制代码
print('number of model params', sum(p.numel() for p in model.parameters() if p.requires_grad))

sum(p.numel() for p in model.parameters() if p.requires_grad )可以用来计算参与训练的参数量

model.parameters() 返回模型中所有参数的迭代器。

if p.requires_grad: 这部分使用了一个条件判断,仅考虑那些 requires_grad 属性为 True 的参数。requires_grad 是 PyTorch 中的一个属性,用于指示是否要在参数上计算梯度。

p.numel(): 对于每个满足条件的参数,p.numel() 返回该参数的元素数量,即参数的总数量。numel() 是 PyTorch 张量对象的方法,用于返回张量中元素的总数。

最后,sum(...) 对所有参数的元素数量求和,得到的结果就是模型中所有可学习参数的总数量。

相关推荐
Aileen_0v01 小时前
【玩转OCR | 腾讯云智能结构化OCR在图像增强与发票识别中的应用实践】
android·java·人工智能·云计算·ocr·腾讯云·玩转腾讯云ocr
阿正的梦工坊2 小时前
深入理解 PyTorch 的 view() 函数:以多头注意力机制(Multi-Head Attention)为例 (中英双语)
人工智能·pytorch·python
Ainnle2 小时前
GPT-O3:简单介绍
人工智能
OceanBase数据库官方博客3 小时前
向量检索+大语言模型,免费搭建基于专属知识库的 RAG 智能助手
人工智能·oceanbase·分布式数据库·向量数据库·rag
测试者家园3 小时前
ChatGPT助力数据可视化与数据分析效率的提升(一)
软件测试·人工智能·信息可视化·chatgpt·数据挖掘·数据分析·用chatgpt做软件测试
Loving_enjoy4 小时前
ChatGPT详解
人工智能·自然语言处理
人类群星闪耀时4 小时前
深度学习在灾难恢复中的作用:智能运维的新时代
运维·人工智能·深度学习
图王大胜5 小时前
模型 确认偏误(关键决策)
人工智能·职业发展·管理·心理·认知·决策
机器懒得学习5 小时前
从随机生成到深度学习:使用DCGAN和CycleGAN生成图像的实战教程
人工智能·深度学习