【Pytorch 第二讲】 如何遍历 或者查看Model权重/参数/tesnsor_size/dict_names

python 复制代码
for (name, param), (key, value) in zip(network.named_parameters(),network.state_dict().items()):
    print(f"{name}   Tensor size: {param.size()}   {key}   Tensor size: {value.size()}")
    print("\nParameter details:")

State_dict keys:

patch_embed.conv_down.0.weight Tensor size: torch.Size([64, 3, 3, 3])

patch_embed.conv_down.1.weight Tensor size: torch.Size([64])

Parameter details: patch_embed.conv_down.1.bias Tensor size: torch.Size([64])

相关推荐
百***787510 分钟前
Grok-4.1与GPT-5.2深度对比:技术差异、适用场景及Python集成指南
java·python·gpt
全栈开发圈12 分钟前
干货分享|鸿蒙6开发实战指南
人工智能·harmonyos·鸿蒙·鸿蒙系统
房产中介行业研习社41 分钟前
2026年1月房产中介管理系统排名
大数据·人工智能
沛沛老爹1 小时前
Web转AI架构篇 Agent Skills vs MCP:工具箱与标准接口的本质区别
java·开发语言·前端·人工智能·架构·企业开发
黎雁·泠崖1 小时前
吃透Java操作符进阶:算术+移位操作符 全解析(Java&C区别+完整案例+避坑指南)
java·c语言·python
ZKNOW甄知科技1 小时前
IT自动分派单据:让企业服务流程更智能、更高效的关键技术
大数据·运维·数据库·人工智能·低代码·自动化
OpenCSG1 小时前
如何通过 AgenticOps x CSGHub 重塑企业 AI 生产力
人工智能
Nautiluss1 小时前
一起调试XVF3800麦克风阵列(十四)
linux·人工智能·音频·语音识别·dsp开发
地瓜伯伯1 小时前
elasticsearch性能调优方法原理与实战
人工智能·elasticsearch·语言模型·数据分析
ZCXZ12385296a1 小时前
YOLO13改进模型C3k2-SFHF实现:阻尼器类型识别与分类系统详解
人工智能·分类·数据挖掘