和鲸社区深度学习基础训练营2025年关卡3_Q1(1)

Q1: 给定一个大小为 32x32x1 的灰度图像(MNIST 手写数字图像),以及一个大小为 3x3x1x8 的卷积核,使用 conv2D_gemm 函数(我们上文中实现的)对图像进行卷积运算,步幅为 1,并填充方式为 same。 请问卷积结果的形状是多少?

1.纯numpy

复制代码
import numpy as np

# 生成随机图像和卷积核
input_image = np.random.rand(32, 32, 1)  # 32x32x1
kernel = np.random.rand(3, 3, 1, 8)     # 3x3x1x8

# 执行卷积运算
output = np.zeros((32, 32, 8))  # 初始化输出数组

# 使用'same'填充方式
pad_width = ((1, 1), (1, 1), (0, 0))
padded_image = np.pad(input_image, pad_width, mode='constant')

# 执行卷积
for i in range(8):  # 对每个卷积核
    for y in range(32):  # 高度方向
        for x in range(32):  # 宽度方向
            # 提取当前3x3区域
            region = padded_image[y:y+3, x:x+3, :]
            # 点乘并求和
            output[y, x, i] = np.sum(region * kernel[:, :, :, i])

print("卷积结果的形状:", output.shape)

运行结果:

2.使用 scipy.signal.convolve2d

复制代码
import numpy as np
from scipy.signal import convolve2d

# 生成随机输入图像和卷积核
input_image = np.random.rand(32, 32, 1)  # 32x32x1
kernel = np.random.rand(3, 3, 1, 8)     # 3x3x1x8

# 初始化输出数组
output = np.zeros((32, 32, 8))

# 对每个卷积核执行卷积
for i in range(8):
    # 提取当前卷积核(3x3x1)
    current_kernel = kernel[:, :, 0, i]
    # 对每个通道执行卷积
    output[:, :, i] = convolve2d(input_image[:, :, 0], current_kernel, 
                                mode='same', boundary='fill')

print("卷积结果的形状:", output.shape)

运行结果:

3.pytorch中的卷积函数

代码1

复制代码
import torch
import torch.nn as nn

conv_layer = nn.Conv2d(in_channels=1, out_channels=8, kernel_size=3, stride=1, padding=1)
input_tensor = torch.randn(1, 1, 32, 32) 
output = conv_layer(input_tensor)
print(output.shape)  # 查看输出张量的形状

代码2

复制代码
import torch
import torch.nn as nn

# 生成随机输入图像和卷积核
input_image = torch.rand(1, 1, 32, 32)  # (batch_size, channels, height, width)
kernel = torch.rand(8, 1, 3, 3)         # (out_channels, in_channels, height, width)

# 创建卷积层
conv = nn.Conv2d(in_channels=1, out_channels=8, kernel_size=3, 
                stride=1, padding=1, bias=False)  # padding=1实现'same'

# 手动设置卷积核权重
conv.weight = nn.Parameter(kernel)

# 执行卷积
output = conv(input_image)

print("卷积结果的形状:", output.shape)

运行结果:

(batch_size, channels, height, width)

相关推荐
小鸡吃米…6 小时前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫6 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)7 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan7 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维7 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS7 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd7 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟8 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然8 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~8 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1