【Pytorch 第二讲】 如何遍历 或者查看Model权重/参数/tesnsor_size/dict_names

python 复制代码
for (name, param), (key, value) in zip(network.named_parameters(),network.state_dict().items()):
    print(f"{name}   Tensor size: {param.size()}   {key}   Tensor size: {value.size()}")
    print("\nParameter details:")

State_dict keys:

patch_embed.conv_down.0.weight Tensor size: torch.Size([64, 3, 3, 3])

patch_embed.conv_down.1.weight Tensor size: torch.Size([64])

Parameter details: patch_embed.conv_down.1.bias Tensor size: torch.Size([64])

相关推荐
嵌入式小企鹅1 小时前
CPU供需趋紧、DeepSeek V4全链适配、小米开源万亿模型
人工智能·学习·开源·嵌入式·小米·算力·昇腾
草莓熊Lotso1 小时前
Vibe Coding 时代:LangChain 与 LangGraph 全链路解析
linux·运维·服务器·数据库·人工智能·mysql·langchain
快乐非自愿2 小时前
RAG夺命10连问,你能抗住第几问?
人工智能·面试·程序员
千匠网络4 小时前
破局出海壁垒,千匠网络新能源汽车跨境出海解决方案
人工智能
方安乐5 小时前
python之向量、向量和、向量点积
开发语言·python·numpy
zh1570236 小时前
JavaScript中WorkerThreads解决服务端计算瓶颈
jvm·数据库·python
马丁聊GEO6 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker6 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.6 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑7 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能