【Pytorch 第二讲】 如何遍历 或者查看Model权重/参数/tesnsor_size/dict_names

python 复制代码
for (name, param), (key, value) in zip(network.named_parameters(),network.state_dict().items()):
    print(f"{name}   Tensor size: {param.size()}   {key}   Tensor size: {value.size()}")
    print("\nParameter details:")

State_dict keys:

patch_embed.conv_down.0.weight Tensor size: torch.Size(64, 3, 3, 3)

patch_embed.conv_down.1.weight Tensor size: torch.Size(64)

Parameter details: patch_embed.conv_down.1.bias Tensor size: torch.Size(64)

相关推荐
星云穿梭14 小时前
用Python写一个带图形界面的学生管理系统——完整教程
python
金銀銅鐵14 小时前
用 Pygame 实现 15 puzzle
python·数学·游戏
jooloo16 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户51914958484516 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户51914958484517 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户0183493016917 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
黄忠20 小时前
大模型之LangGraph技术体系
python·llm
这token有力气21 小时前
Function Calling 格式漂移
人工智能
onething36521 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
onething36521 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 6 —— 业务完善 + 会话消息预览
人工智能·后端·全栈