pytorch打印模型结构和参数

两种方式

当我们使用pytorch进行模型训练或测试时,有时候希望能知道模型每一层分别是什么,具有怎样的参数。此时我们可以将模型打印出来,输出每一层的名字、类型、参数等。

常用的命令行打印模型结构的方法有两种:

  • 一是直接print
  • 二是使用torchsummary库的summary
    但是二者在输出上有着一些区别。首先说结论:
    print输出结果是每一层的名字、类别、以及构造时的参数,例如对于卷积层,还包括用户定义的stride、bias等;而torch summary则会打印类别、深度、输出Tensor的形状、参数数量等。
    这也是很重要的一点,print打印的每一层顺序,是模型init函数中定义的顺序,而torchsummary则是模型执行起来输入张量真正计算的顺序。

torch summary 安装:

示例

print:

summary:

打印每一层的输入输出结构

python 复制代码
import torch
from torch import nn
#from d2l import torch as d2l

net1D = nn.Sequential(nn.Conv1d(1,6,kernel_size=5,padding=2),nn.Sigmoid(),
                    nn.AvgPool1d(kernel_size=2,stride=2),
                    nn.Conv1d(6,16,kernel_size=5),nn.Sigmoid(),
                    nn.AvgPool1d(kernel_size=2,stride=2),
                    nn.Flatten(),
                    nn.Linear(16*5,120),nn.Sigmoid(), # 这边要根据上面的输出重新计算拉平后的大小
                    nn.Linear(120,84),nn.Sigmoid(),
                    nn.Linear(84,2)
                    )
Y=torch.rand(size=(1,1,28),dtype=torch.float32)  # 批次大小,通道数,长度
for layer in net1D:
    Y=layer(Y)
    print(layer.__class__.__name__, 'output shape: \t',Y.shape)
out 复制代码
Conv1d output shape:      torch.Size([1, 6, 28])
Sigmoid output shape:      torch.Size([1, 6, 28])
AvgPool1d output shape:      torch.Size([1, 6, 14])
Conv1d output shape:      torch.Size([1, 16, 10])
Sigmoid output shape:      torch.Size([1, 16, 10])
AvgPool1d output shape:      torch.Size([1, 16, 5])
Flatten output shape:      torch.Size([1, 80])
Linear output shape:      torch.Size([1, 120])
Sigmoid output shape:      torch.Size([1, 120])
Linear output shape:      torch.Size([1, 84])
Sigmoid output shape:      torch.Size([1, 84])
Linear output shape:      torch.Size([1, 2])
相关推荐
一点媛艺2 小时前
Kotlin函数由易到难
开发语言·python·kotlin
qzhqbb2 小时前
基于统计方法的语言模型
人工智能·语言模型·easyui
冷眼看人间恩怨3 小时前
【话题讨论】AI大模型重塑软件开发:定义、应用、优势与挑战
人工智能·ai编程·软件开发
2401_883041083 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
魔道不误砍柴功3 小时前
Java 中如何巧妙应用 Function 让方法复用性更强
java·开发语言·python
_.Switch3 小时前
高级Python自动化运维:容器安全与网络策略的深度解析
运维·网络·python·安全·自动化·devops
AI极客菌4 小时前
Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
人工智能·计算机视觉·ai作画·stable diffusion·aigc·flux·人工智能作画
阿_旭4 小时前
一文读懂| 自注意力与交叉注意力机制在计算机视觉中作用与基本原理
人工智能·深度学习·计算机视觉·cross-attention·self-attention
王哈哈^_^4 小时前
【数据集】【YOLO】【目标检测】交通事故识别数据集 8939 张,YOLO道路事故目标检测实战训练教程!
前端·人工智能·深度学习·yolo·目标检测·计算机视觉·pyqt
测开小菜鸟4 小时前
使用python向钉钉群聊发送消息
java·python·钉钉