【Pytorch 第二讲】 如何遍历 或者查看Model权重/参数/tesnsor_size/dict_names

python 复制代码
for (name, param), (key, value) in zip(network.named_parameters(),network.state_dict().items()):
    print(f"{name}   Tensor size: {param.size()}   {key}   Tensor size: {value.size()}")
    print("\nParameter details:")

State_dict keys:

patch_embed.conv_down.0.weight Tensor size: torch.Size([64, 3, 3, 3])

patch_embed.conv_down.1.weight Tensor size: torch.Size([64])

Parameter details: patch_embed.conv_down.1.bias Tensor size: torch.Size([64])

相关推荐
Elaine33612 小时前
机器学习概述
人工智能·机器学习·华为云
无心水12 小时前
【Hermes:实战场景】35、内容创作实战:系列文章、风格固化、子 Agent 并行调研
人工智能·openclaw·养龙虾·hermes·honcho
Volunteer Technology12 小时前
携程智能体项目
人工智能·python·numpy
初心未改HD12 小时前
机器学习之线性回归与岭回归详解
人工智能·机器学习·线性回归
平安的平安12 小时前
Python实现RAG检索增强生成:让大模型拥有你的私有知识库
开发语言·python
DogDaoDao12 小时前
【GitHub】SuperClaude Framework深度解析:将Claude Code打造为专业开发平台的元编程配置框架
人工智能·深度学习·程序员·大模型·github·ai编程·claude
技术程序猿华锋13 小时前
Hermes Agent 深度实战:安装部署、Docker 配置、API 接入与生产环境最佳实践教程
运维·人工智能·docker·容器·agi
暗夜猎手-大魔王13 小时前
OpenClaw上下文工程学习
人工智能
情绪总是阴雨天~13 小时前
机器学习与深度学习核心问题解决方案:过拟合与样本不均衡
人工智能·深度学习·机器学习
code bean13 小时前
【LangChain】少样本提示(Few-Shot Prompting)实战指南
开发语言·python·langchain