Pytorch 之torch.nn初探 池化--Pooling Layers

任务描述

本关任务:本关提供了一个Variable 类型的变量x,要求按照条件创建一个Conv2d变量conv,一个MaxPool2d变量pool,对x应用卷积和最大池化操作并赋值给变量outpout_pool,并输出outpout_pool 的大小。

相关知识

Pytorch 中池化分为两种:

  • 最大池化MaxPool
  • 平均池化 AvgPool

MaxPool

|-------------|-----------------|
| MaxPool | 描述 |
| MaxPool1d | 对输入信号应用1维最大池化操作 |
| MaxPool2d | 对输入信号应用2维最大池化操作 |
| MaxPool3d | 对输入信号应用3维最大池化操作 |

下面以MaxPool1d做详细介绍,2维和3维只是在1维的基础上计算了长宽、长宽高的池化。

函数定义:

torch.nn.MaxPool1d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

若输入大小为: (N ,C ,L ),则输出大小为:(N ,C ,L o u t)的计算方式如下:

参数说明:

|----------------|------------------------|------------------------------------|-----------------|
| 参数名 | 参数类型 | 说明 | 默认值 |
| kernel_size | int或tuple | 最大池化窗口的大小 | |
| stride | int or tuple, optional | 滑动窗口 | 默认为 kernel_size |
| padding | int or tuple, optional | 在两侧添加隐式零进行填充 | |
| dilation | int or tuple, optional | 控制窗口中元素步幅的参数 | |
| return_indices | boolean ,optional | 如果等于True,会返回输出最大值的序号,对于上采样操作会有帮助 | |
| ceil_mode | boolean ,optional | 如果等于True,计算输出信号大小的时候,会使用向上取整(ceil) | 默认的向下取整(floor) |

维度: Input: (N ,C ,L ) Output: (N ,C ,L o u t)

应用示例:

复制代码
# pool of size=3, stride=2
m = nn.MaxPool1d(3, stride=2)
input = Variable(torch.Tensor([[[1,2,3,4,5,6,7]]]))
output = m(input)
print(output.size())

输出结果:

Variable containing:(0 ,.,.) = 3 5 7[torch.FloatTensor of size 1x1x3]

AvgPool

|-------------|-----------------|
| AvgPool | 描述 |
| AvgPool1d | 对输入信号应用1维平均池化操作 |
| AvgPool2d | 对输入信号应用2维平均池化操作 |
| AvgPool3d | 对输入信号应用3维平均池化操作 |

下面以AvgPool1d做详细介绍,2维和3维只是在1维的基础上计算了长宽、长宽高的池化。

函数定义:

torch.nn.AvgPool1d(kernel_size, stride=None, padding=0, ceil_mode=False, count_include_pad=True)

若输入大小: (N ,C ,L ),输出大小(N ,C ,L o u t)和池化窗口大小k的关系是

如果填充不为零,则输入在两侧都会隐式填充零。

参数kernel_size,stride,padding可以是一个int或一个元素的元组。

参数说明:

|---------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------|------------------------------------|-----------------|
| 参数名 | 参数类型 | 说明 | 默认值 |
| kernel_size | int或tuple | 最大池化窗口的大小 | |
| stride | int or tuple, optional | 滑动窗口 | 默认为 kernel_size |
| padding | int or tuple, optional | 在两侧添加隐式零进行填充 | |
| ceil_mode | boolean ,optional | 如果等于True,计算输出信号大小的时候,会使用向上取整(ceil) | 默认的向下取整(floor) |
| count_include_pad | boolean ,optional | 如果等于True,将在求平均的计算中用0填充 | |
| 维度 | | | |
| Input: (N ,C ,L) | | | |
| Output: (N ,C ,L o u t) | | | |
| L o u t =f l o o r ((L i n +2∗p a d d i n gk e r n e l s i z e )/s t r i d e+1) | | | |

应用示例:

复制代码
# pool with window of size=3, stride=2
m = nn.AvgPool1d(3, stride=2)
output = m(Variable(torch.Tensor([[[1,2,3,4,5,6,7]]])))
print(output)

输出结果:

Variable containing:(0 ,.,.) = 2 4 6[torch.FloatTensor of size 1x1x3]

编程要求

本关涉及的代码文件为pool.py,本次编程任务是补全右侧代码片段中Begin至End中间的代码,具体要求如下:

  • 创建一个in_channels=3, out_channels=32, kernel_size=(3, 3), stride=1, padding=1, bias=True的Conv2d变量conv;
  • 创建一个kernel_size=(2, 2), stride=2的MaxPool2d变量pool;
  • 对x应用卷积和最大池化操作并赋值给变量outpout_pool;
  • 输出 outpout_pool 的大小。
  • 具体请参见后续测试样例。

测试说明

测试过程:

  • 本关涉及的测试文件为pool.py,运行用户填写后的程序判断正误。
  • 测试程序将检测两个方面:是否包含特定的代码行以及程序的输出是否正确,若两个方面均正确则输出下面的预期输出,否则报错。
  • 请注意输出格式及规范。
  • 注意,在声明变量时请按照提示命名,否则将会报错。

以下是测试样例:

测试输入: 预期输出:

Pool output size : torch.Size([10, 32, 14, 14])

Congratulation!

代码实战

复制代码
import torch
import torch.nn as nn
from torch.autograd import Variable
x = Variable(torch.randn(10, 3, 28, 28))

#/********** Begin *********/

#创建一个in_channels=3, out_channels=32, kernel_size=(3, 3), stride=1, padding=1, bias=True的Conv2d变量conv
conv=nn.Conv2d(3,32,(3,3),1,1,bias=True)

#创建一个kernel_size=(2, 2), stride=2的MaxPool2d变量pool
pool=nn.MaxPool2d((2,2),2)

#对x应用卷积和最大池化操作并赋值给变量outpout_pool
outpout_pool=pool(conv(x))

#输出 outpout_pool 的大小,要求输出打印不换行
print('Pool output size : ',outpout_pool.size())
#/********** End *********/
相关推荐
大龄程序员狗哥8 小时前
第47篇:使用Speech-to-Text API快速构建语音应用(操作教程)
人工智能
KKKlucifer8 小时前
数据安全合规自动化:策略落地、审计追溯与风险闭环技术解析
人工智能·安全
RWKV元始智能8 小时前
RWKV超并发项目教程,RWKV-LM训练提速40%
人工智能·rnn·深度学习·自然语言处理·开源
dyj0958 小时前
Dify - (一)、本地部署Dify+聊天助手/Agent
人工智能·docker·容器
墨染天姬8 小时前
【AI】Hermes的GEPA算法
人工智能·算法
小超同学你好8 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
紫微AI8 小时前
前端文本测量成了卡死一切创新的最后瓶颈,pretext实现突破了
前端·人工智能·typescript
码途漫谈9 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
易连EDI—EasyLink9 小时前
易连EDI–EasyLink实现OCR智能数据采集
网络·人工智能·安全·汽车·ocr·edi
冬奇Lab9 小时前
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
人工智能·langchain·llm