【chatgpt】pytorch打印模型model参数,使用parameters()方法和named_parameters()方法

在 PyTorch 中,一个模型的参数通常指模型中所有可训练的权重和偏置。每个 nn.Module 对象(包括自定义的神经网络类)都有一个 parameters() 方法和一个 named_parameters() 方法,这些方法可以用来访问模型中的所有参数。以下是这些方法的详细解释和使用示例。

参数的获取方法

  1. parameters():返回模型中所有参数的一个生成器。
  2. named_parameters():返回一个生成器,生成模型中所有参数的名称和参数张量。

示例:定义并获取模型的参数

下面是一个包含多个线性层的简单神经网络示例,并展示如何获取和打印模型的所有参数。

定义一个简单的神经网络
python 复制代码
import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(4, 3)
        self.fc2 = nn.Linear(3, 2)
        self.fc3 = nn.Linear(2, 1)

    def forward(self, x):
        x = self.fc1(x)
        x = torch.relu(x)
        x = self.fc2(x)
        x = torch.relu(x)
        x = self.fc3(x)
        return x

# 实例化神经网络
model = SimpleNN()
获取并打印模型的所有参数
  1. 使用 parameters() 方法获取模型所有参数
python 复制代码
print("模型的所有参数:")
for param in model.parameters():
    print(param)
  1. 使用 named_parameters() 方法获取模型所有参数及其名称
python 复制代码
print("模型的所有参数及其名称:")
for name, param in model.named_parameters():
    print(f"参数名称: {name}")
    print(f"参数值:\n{param}")
    print(f"参数的形状: {param.shape}")
    print()

示例输出

输出可能类似于以下内容(具体数值会因为参数初始化而不同):

复制代码
模型的所有参数及其名称:
参数名称: fc1.weight
参数值:
Parameter containing:
tensor([[ 0.0841,  0.0476,  0.0294, -0.1092],
        [ 0.1422, -0.0623,  0.1579, -0.0781],
        [ 0.0924,  0.1263, -0.1484,  0.0397]], requires_grad=True)
参数的形状: torch.Size([3, 4])

参数名称: fc1.bias
参数值:
Parameter containing:
tensor([0.0457, 0.0912, 0.0273], requires_grad=True)
参数的形状: torch.Size([3])

参数名称: fc2.weight
参数值:
Parameter containing:
tensor([[ 0.0570,  0.0563, -0.1074],
        [ 0.0768, -0.0612,  0.1292]], requires_grad=True)
参数的形状: torch.Size([2, 3])

参数名称: fc2.bias
参数值:
Parameter containing:
tensor([ 0.0428, -0.1312], requires_grad=True)
参数的形状: torch.Size([2])

参数名称: fc3.weight
参数值:
Parameter containing:
tensor([[ 0.0825,  0.0076]], requires_grad=True)
参数的形状: torch.Size([1, 2])

参数名称: fc3.bias
参数值:
Parameter containing:
tensor([0.0963], requires_grad=True)
参数的形状: torch.Size([1])

总结

  • parameters() 方法返回模型所有参数的生成器。
  • named_parameters() 方法返回模型所有参数及其名称的生成器。
  • 通过这些方法,可以方便地访问和打印模型中的所有参数,有助于检查模型的配置和调试。

这些方法对于了解和调试模型的参数配置非常有用,使得你能够全面掌握模型内部的具体情况。

相关推荐
Juchecar2 小时前
一文讲清 nn.Sequential 等容器类
人工智能
阿里云云原生2 小时前
如何快速看懂「祖传项目」?Qoder 强势推出新利器
人工智能
美团技术团队2 小时前
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
人工智能·算法
程序员小袁4 小时前
基于C-MTEB/CMedQAv2-rerankingv的Qwen3-1.7b模型微调-demo
人工智能
飞哥数智坊5 小时前
AI 编程一年多,我终于明白:比技巧更重要的,是熟练度
人工智能·ai编程
新智元5 小时前
收手吧 GPT-5-Codex,外面全是 AI 编程智能体!
人工智能·openai
IT_陈寒5 小时前
Java 性能优化:5个被低估的JVM参数让你的应用吞吐量提升50%
前端·人工智能·后端
阿里云云原生6 小时前
阿里云基础设施 AI Tech Day AI 原生,智构未来——AI 原生架构与企业实践专场
人工智能
Memene摸鱼日报7 小时前
「Memene 摸鱼日报 2025.9.16」OpenAI 推出 GPT-5-Codex 编程模型,xAI 发布 Grok 4 Fast
人工智能·aigc
xiaohouzi1122337 小时前
OpenCV的cv2.VideoCapture如何加GStreamer后端
人工智能·opencv·计算机视觉