深度学习代码片段收集

python 复制代码
print('number of model params', sum(p.numel() for p in model.parameters() if p.requires_grad))

sum(p.numel() for p in model.parameters() if p.requires_grad )可以用来计算参与训练的参数量

model.parameters() 返回模型中所有参数的迭代器。

if p.requires_grad: 这部分使用了一个条件判断,仅考虑那些 requires_grad 属性为 True 的参数。requires_grad 是 PyTorch 中的一个属性,用于指示是否要在参数上计算梯度。

p.numel(): 对于每个满足条件的参数,p.numel() 返回该参数的元素数量,即参数的总数量。numel() 是 PyTorch 张量对象的方法,用于返回张量中元素的总数。

最后,sum(...) 对所有参数的元素数量求和,得到的结果就是模型中所有可学习参数的总数量。

相关推荐
吴佳浩11 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒12 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海12 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠12 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao12 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理
Lihua奏13 小时前
从单核到多核:CPU为什么不能再只靠提频变快
深度学习
程序员cxuan13 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员
机器之心13 小时前
AI圈刚开始谈Loop Engineering,两位95后博士已经盯上了人类闭环数据
人工智能·openai
澄旭14 小时前
一文讲清 MCP:AI 应用连接外部世界的标准协议
人工智能
机器之心14 小时前
不只DeepSeek,阶跃等开源JetSpec:大模型解码提速近10倍
人工智能·openai