深度学习代码片段收集

python 复制代码
print('number of model params', sum(p.numel() for p in model.parameters() if p.requires_grad))

sum(p.numel() for p in model.parameters() if p.requires_grad )可以用来计算参与训练的参数量

model.parameters() 返回模型中所有参数的迭代器。

if p.requires_grad: 这部分使用了一个条件判断,仅考虑那些 requires_grad 属性为 True 的参数。requires_grad 是 PyTorch 中的一个属性,用于指示是否要在参数上计算梯度。

p.numel(): 对于每个满足条件的参数,p.numel() 返回该参数的元素数量,即参数的总数量。numel() 是 PyTorch 张量对象的方法,用于返回张量中元素的总数。

最后,sum(...) 对所有参数的元素数量求和,得到的结果就是模型中所有可学习参数的总数量。

相关推荐
刘一说15 小时前
AI科技热点日报 | 2026年6月1日
人工智能·科技
阿里云大数据AI技术15 小时前
性能提升20倍:阿里云 Milvus 深度优化磁盘索引,重新定义亿级向量检索
人工智能
包子BI大数据15 小时前
3.openclaw小龙虾简单版安装教程
人工智能·python·ai
zhangfeng113315 小时前
超算/曙光DCU集群 昆山站 根目录文件夹逐项释义(HTC调度集群环境、国产DCU算力节点)
人工智能·pytorch·机器学习
格桑阿sir15 小时前
15-大模型智能体开发工程师:深度学习MCP协议(Model Context Protocol)
人工智能·ai·大模型·agent·sse·mcp·streamable http
程序员佳佳15 小时前
深度解析:向量引擎如何影响AI内容收录?附3个月实测数据
人工智能·gpt·自动化·ai写作·codex
feng145615 小时前
OpenSREClaw - AI 本体论思维
运维·人工智能
zhangxingchao15 小时前
AI应用开发八:RAG相关技术总结
前端·人工智能·后端
码农小旋风16 小时前
国内使用 Claude 的 5 种路径:网页、订阅、API 和企业方案怎么选
人工智能·chatgpt
清水寺小和尚16 小时前
MCP 协议拆解:从 JSON-RPC 信封到 Agent 全链路
人工智能