查看模型参数量

跑完的模型存为best_model.pth文件,怎么可以快速计算该模型的参数量。

第一步,(我选择在pycharm的terminal中)先查看文件的结构:

bash 复制代码
python -c "import torch; print(list(torch.load('替换模型路径/best_model.pth').keys()))"

解释一下,其中:

  • torch.load(): 加载PyTorch保存的文件
  • .keys(): 获取文件中的所有键(即保存的内容项)
  • print(list(...)): 打印键的列表

输出示例:

bash 复制代码
['epoch', 'model', 'optimizer', '...']
# 其中,model代表 模型参数(也可能是:state_dict、model_state_dict)

第二步,基于上述输出结果,从model键中提取模型参数并计算总数:

bash 复制代码
python -c "import torch; ckpt=torch.load('替换模型路径/best_model.pth'); model_dict=ckpt['model']; total=sum(p.numel() for p in model_dict.values() if isinstance(p, torch.Tensor)); print(f'模型参数量: {total:,} (≈{total*4/1024/1024:.1f} MB)')"

解释一下,其中:

  • ckpt['model']: 获取模型参数字典

  • model_dict.values(): 获取所有参数张量

  • p.numel(): 计算每个张量的元素个数(参数数量)

  • isinstance(p, torch.Tensor): 确保是张量类型

  • sum(...): 累加所有参数

  • total*4/1024/1024: 计算模型大小(假设float32,每个参数4字节)

最终输出:

模型参数量:XXX(XXMB)

相关推荐
F_U_N_1 天前
效率提升80%:AI全流程研发真实项目落地复盘
人工智能·ai编程
月诸清酒1 天前
24-260409 AI 科技日报 (Gemma 4发布一周下载破千万,开源模型生态加速演进)
人工智能·开源
2501_933329551 天前
技术架构深度解析:Infoseek舆情监测系统的全链路设计与GEO时代的技术实践
开发语言·人工智能·分布式·架构
He少年1 天前
【基础知识、Skill、Rules和MCP案例介绍】
java·前端·python
X journey1 天前
机器学习进阶(16):如何防止过拟合
人工智能·机器学习
AI_Claude_code1 天前
ZLibrary访问困境方案四:利用Cloudflare Workers等边缘计算实现访问
javascript·人工智能·爬虫·python·网络爬虫·边缘计算·爬山算法
学海星球1 天前
Claude Code 开发实战:从入门到精通的完整指南
人工智能
一次旅行1 天前
Hermes Agent接入飞书
人工智能·飞书
月诸清酒1 天前
26-260410 AI 科技日报 (阿里开源视频模型HappyHorse登顶,马斯克疑似泄露Claude参数)
人工智能·开源·音视频
jedi-knight1 天前
AGI时代下的青年教师与学术民主化
人工智能·python·agi