【Pytorch 第二讲】 如何遍历 或者查看Model权重/参数/tesnsor_size/dict_names

python 复制代码
for (name, param), (key, value) in zip(network.named_parameters(),network.state_dict().items()):
    print(f"{name}   Tensor size: {param.size()}   {key}   Tensor size: {value.size()}")
    print("\nParameter details:")

State_dict keys:

patch_embed.conv_down.0.weight Tensor size: torch.Size([64, 3, 3, 3])

patch_embed.conv_down.1.weight Tensor size: torch.Size([64])

Parameter details: patch_embed.conv_down.1.bias Tensor size: torch.Size([64])

相关推荐
智慧化智能化数字化方案6 小时前
财务数字化——解读农化集团业财一体化数字化转型解决方案【附全文阅读】
大数据·人工智能
香芋Yu6 小时前
【大模型面试突击】01_传统NLP基础
人工智能·自然语言处理
琅琊榜首20207 小时前
AI+编程实操:小说高效改编短剧的全流程指南
大数据·人工智能
一个处女座的程序猿O(∩_∩)O7 小时前
Python函数参数*args和**kwargs完全指南:从入门到精通
开发语言·python
倔强青铜三7 小时前
LlamaIndex官方揭秘:如何构建安全的AI编码智能体
人工智能·aigc·ai编程
好家伙VCC7 小时前
**发散创新:编译器优化实战——从LLVM IR到性能飞跃的奇妙旅程**
java·开发语言·python·算法
大尚来也7 小时前
Python 中使用 ezdxf:轻松读写 DXF 文件的完整指南
开发语言·python
lczdyx7 小时前
【胶囊网络 - 简明教程】02-1 胶囊网络 - 整体架构设计
人工智能·深度学习·机器学习·ai·大模型·反向传播·胶囊网络
小雨中_7 小时前
2.6 时序差分方法(Temporal Difference, TD)
人工智能·python·深度学习·机器学习·自然语言处理
落羽的落羽7 小时前
【Linux系统】磁盘ext文件系统与软硬链接
linux·运维·服务器·数据库·c++·人工智能·机器学习