【Pytorch 第二讲】 如何遍历 或者查看Model权重/参数/tesnsor_size/dict_names

python 复制代码
for (name, param), (key, value) in zip(network.named_parameters(),network.state_dict().items()):
    print(f"{name}   Tensor size: {param.size()}   {key}   Tensor size: {value.size()}")
    print("\nParameter details:")

State_dict keys:

patch_embed.conv_down.0.weight Tensor size: torch.Size([64, 3, 3, 3])

patch_embed.conv_down.1.weight Tensor size: torch.Size([64])

Parameter details: patch_embed.conv_down.1.bias Tensor size: torch.Size([64])

相关推荐
APIshop4 分钟前
用 Python 把“API 接口”当数据源——从找口子到落库的全流程实战
开发语言·python
Mr.Lee jack20 分钟前
【torch.compile】LazyTensor延迟执行机制
pytorch
九河云31 分钟前
华为云 ECS 弹性伸缩技术:应对业务峰值的算力动态调度策略
大数据·服务器·人工智能·物联网·华为云
一点晖光1 小时前
Docker 作图咒语生成器搭建指南
python·docker
IT空门:门主1 小时前
Spring AI的教程,持续更新......
java·人工智能·spring·spring ai
smj2302_796826521 小时前
解决leetcode第3768题.固定长度子数组中的最小逆序对数目
python·算法·leetcode
美狐美颜SDK开放平台1 小时前
美颜sdk是什么?如何将美颜SDK接入安卓/iOS直播平台?
人工智能·美颜sdk·直播美颜sdk·美颜api·美狐美颜sdk
AI营销资讯站1 小时前
AI营销内容生产:哪些平台支持全球多语言内容同步生产?
大数据·人工智能
木头左1 小时前
位置编码增强法在量化交易策略中的应用基于短期记忆敏感度提升
python
Acc1oFl4g1 小时前
详解Java反射
java·开发语言·python