pytorch打印模型结构和参数

两种方式

当我们使用pytorch进行模型训练或测试时,有时候希望能知道模型每一层分别是什么,具有怎样的参数。此时我们可以将模型打印出来,输出每一层的名字、类型、参数等。

常用的命令行打印模型结构的方法有两种:

  • 一是直接print
  • 二是使用torchsummary库的summary
    但是二者在输出上有着一些区别。首先说结论:
    print输出结果是每一层的名字、类别、以及构造时的参数,例如对于卷积层,还包括用户定义的stride、bias等;而torch summary则会打印类别、深度、输出Tensor的形状、参数数量等。
    这也是很重要的一点,print打印的每一层顺序,是模型init函数中定义的顺序,而torchsummary则是模型执行起来输入张量真正计算的顺序。

torch summary 安装:

示例

print:

summary:

打印每一层的输入输出结构

python 复制代码
import torch
from torch import nn
#from d2l import torch as d2l

net1D = nn.Sequential(nn.Conv1d(1,6,kernel_size=5,padding=2),nn.Sigmoid(),
                    nn.AvgPool1d(kernel_size=2,stride=2),
                    nn.Conv1d(6,16,kernel_size=5),nn.Sigmoid(),
                    nn.AvgPool1d(kernel_size=2,stride=2),
                    nn.Flatten(),
                    nn.Linear(16*5,120),nn.Sigmoid(), # 这边要根据上面的输出重新计算拉平后的大小
                    nn.Linear(120,84),nn.Sigmoid(),
                    nn.Linear(84,2)
                    )
Y=torch.rand(size=(1,1,28),dtype=torch.float32)  # 批次大小,通道数,长度
for layer in net1D:
    Y=layer(Y)
    print(layer.__class__.__name__, 'output shape: \t',Y.shape)
out 复制代码
Conv1d output shape:      torch.Size([1, 6, 28])
Sigmoid output shape:      torch.Size([1, 6, 28])
AvgPool1d output shape:      torch.Size([1, 6, 14])
Conv1d output shape:      torch.Size([1, 16, 10])
Sigmoid output shape:      torch.Size([1, 16, 10])
AvgPool1d output shape:      torch.Size([1, 16, 5])
Flatten output shape:      torch.Size([1, 80])
Linear output shape:      torch.Size([1, 120])
Sigmoid output shape:      torch.Size([1, 120])
Linear output shape:      torch.Size([1, 84])
Sigmoid output shape:      torch.Size([1, 84])
Linear output shape:      torch.Size([1, 2])
相关推荐
躺平大鹅2 小时前
5个实用Python小脚本,新手也能轻松实现(附完整代码)
python
m0_563745112 小时前
误差卡尔曼滤波在VINS-mono中的应用
人工智能·机器学习
yukai080082 小时前
【最后203篇系列】039 JWT使用
python
恣逍信点3 小时前
《凌微经 · 理悖相涵》第六章 理悖相涵——关系构型之模因
人工智能·科技·程序人生·生活·交友·哲学
晚霞的不甘3 小时前
Flutter for OpenHarmony 可视化教学:A* 寻路算法的交互式演示
人工智能·算法·flutter·架构·开源·音视频
小程故事多_803 小时前
Agent Infra核心技术解析:Sandbox sandbox技术原理、选型逻辑与主流方案全景
java·开发语言·人工智能·aigc
陈天伟教授3 小时前
人工智能应用- 语言处理:02.机器翻译:规则方法
人工智能·深度学习·神经网络·语言模型·自然语言处理·机器翻译
独好紫罗兰3 小时前
对python的再认识-基于数据结构进行-a006-元组-拓展
开发语言·数据结构·python
Dfreedom.3 小时前
图像直方图完全解析:从原理到实战应用
图像处理·python·opencv·直方图·直方图均衡化
人机与认知实验室3 小时前
一些容易被人工智能取代的职业
人工智能