【深度学习基础篇】手算卷积神经网络:13道经典题全解析(考研/面试必备)

【深度学习基础篇】手算卷积神经网络:13道经典题全解析(考研/面试必备)

卷积神经网络是深度学习的核心,而手算卷积尺寸和参数量是理解其原理的第一步。本文整理了13道经典手算题,先给出题目供读者自测,再提供详细解答和关键公式总结,帮助大家彻底掌握卷积计算。


一、基础单通道卷积(7题)

题目自测

  1. 现有特征图4×4,卷积核大小为2,卷出来的特征图多大?卷积核的参数量多少?
  2. 现有特征图4×4,卷积核大小为3,卷出来的特征图多大?
  3. 现有特征图4×4,卷积核大小为3,padding=1,卷出来的特征图多大?
  4. 现有特征图100×100,卷积核大小为3,卷出来的特征图多大?
  5. 现有特征图100×100,卷积核大小为3,padding=1,卷出来的特征图多大?
  6. 特征图8×8,卷积核大小为7,卷出来的特征图多大?这个卷积核的参数量多少?
  7. 特征图100×100,卷积核大小为7,卷出来的特征图多大?

二、进阶多通道卷积(6题)

题目自测

  1. 特征图100×100,卷积核大小为7,padding多少,特征图大小不变?
  2. 特征图224×224,卷积核大小为5,padding=2,卷出来的特征图多大?
  3. 特征图3×4×4,padding=1,卷积核数量1,卷出来的特征图为1×4×4。这套卷积核多大?卷积核的参数量多少?
  4. 特征图3×4×4,卷积核3×3×3,padding=1,卷积核数量7,卷出来的特征图多大?
  5. 特征图3×224×224,卷积核3×3×3,padding=1,卷积核数量64,卷出来的特征图多大?
  6. 特征图64×224×224,卷积核X×3×3,padding=1,卷积核数量128。卷出来的特征图多大?X是多少?这套卷积核的参数量多少?

三、详细解答和关键步骤

默认步长 stride = 1,输入通道数 C_in = 1(单通道)。

核心公式

  • 输出尺寸输出尺寸 = 输入尺寸 - 卷积核大小 + 2 × padding + 1
  • 参数量(单通道)参数量 = 卷积核大小 × 卷积核大小

(一)基础单通道卷积解答

  1. 特征图4×4,卷积核2×2,padding=0

    • 输出尺寸:4 - 2 + 0 + 1 = 33×3
    • 参数量:2 × 2 = 4
    • 关键:无padding时,直接套用基础公式。
  2. 特征图4×4,卷积核3×3,padding=0

    • 输出尺寸:4 - 3 + 0 + 1 = 22×2
    • 关键:注意卷积核不能超过特征图尺寸。
  3. 特征图4×4,卷积核3×3,padding=1

    • 输出尺寸:4 - 3 + 2×1 + 1 = 44×4
    • 关键 :当 padding = (卷积核大小 - 1) / 2 时,输出尺寸与输入尺寸相同。
  4. 特征图100×100,卷积核3×3,padding=0

    • 输出尺寸:100 - 3 + 0 + 1 = 9898×98
  5. 特征图100×100,卷积核3×3,padding=1

    • 输出尺寸:100 - 3 + 2×1 + 1 = 100100×100
    • 易错点 :容易忘记公式最后的 +1,导致算成99×99。
  6. 特征图8×8,卷积核7×7,padding=0

    • 输出尺寸:8 - 7 + 0 + 1 = 22×2
    • 参数量:7 × 7 = 49
  7. 特征图100×100,卷积核7×7,padding=0

    • 输出尺寸:100 - 7 + 0 + 1 = 9494×94

(二)进阶多通道卷积解答

核心公式:

  • 卷积核尺寸输入通道数 × 卷积核空间尺寸 × 卷积核空间尺寸 (如 3×3×3)
  • 参数量(多通道)参数量 = 输入通道数 × 卷积核空间尺寸 × 卷积核空间尺寸 × 输出通道数
  • 输出特征图输出通道数 × 输出空间尺寸 × 输出空间尺寸
  1. 特征图100×100,卷积核7×7,求padding使大小不变

    • 公式:padding = (卷积核大小 - 1) / 2
    • 计算:(7 - 1) / 2 = 3
    • 答案3
    • 关键:这是保持特征图尺寸不变的黄金法则。
  2. 特征图224×224,卷积核5×5,padding=2

    • 输出尺寸:224 - 5 + 2×2 + 1 = 224224×224
    • 验证padding = (5 - 1) / 2 = 2,符合尺寸不变法则。
  3. 特征图3×4×4,padding=1,卷积核数量1,输出1×4×4

    • 卷积核大小:输入通道数为3,空间尺寸需保持4×4,故卷积核为 3×3×3
    • 参数量:3 × 3 × 3 = 27
    • 关键:卷积核的输入通道数必须与输入特征图的通道数一致。
  4. 特征图3×4×4,卷积核3×3×3,padding=1,卷积核数量7

    • 空间尺寸:4 - 3 + 2×1 + 1 = 4
    • 输出特征图:7×4×4
  5. 特征图3×224×224,卷积核3×3×3,padding=1,卷积核数量64

    • 空间尺寸:224 - 3 + 2×1 + 1 = 224
    • 输出特征图:64×224×224
  6. 特征图64×224×224,卷积核X×3×3,padding=1,卷积核数量128

    • X的值:卷积核输入通道数必须等于输入特征图通道数,故 X = 64
    • 空间尺寸:224 - 3 + 2×1 + 1 = 224
    • 输出特征图:128×224×224
    • 参数量:64 × 3 × 3 × 128 = 73728

四、关键公式总结

场景 核心公式 备注
单通道输出尺寸 输出尺寸 = 输入尺寸 - K + 2P + 1 K=卷积核大小, P=padding, stride=1
多通道输出尺寸 与单通道公式相同 尺寸只与空间维度有关
单通道参数量 K × K 输入通道数为1
多通道参数量 C_in × K × K × C_out C_in=输入通道数, C_out=输出通道数
尺寸不变法则 P = (K - 1) / 2 当stride=1时,输出尺寸等于输入尺寸

五、学习复盘建议

  1. 牢记公式:输出尺寸和参数量的公式是基础,必须烂熟于心。
  2. 注意通道数:多通道卷积中,卷积核的输入通道数必须与输入特征图的通道数一致。
  3. 黄金法则padding = (K - 1) / 2 是保持尺寸不变的关键,在网络设计中非常常用。
  4. 多练手算:通过大量练习,培养对卷积计算的直觉,这对理解网络结构和排查问题非常有帮助。

本文由 [ppppppatrick] 整理,适合深度学习入门、考研复试和算法面试备考。如果对你有帮助,欢迎点赞、收藏、关注~

相关推荐
小糖学代码12 分钟前
LLM系列:2.pytorch入门:8.神经网络的损失函数(criterion)
人工智能·深度学习·神经网络
Jmayday20 分钟前
Pytorch:RNN理论基础
pytorch·rnn·深度学习
AI周红伟2 小时前
周红伟:GPT-Image-2深度解析:从技术原理到实战教程,为什么它能让整个AI圈炸锅?
人工智能·gpt·深度学习·机器学习·语言模型·openclaw
端平入洛3 小时前
梯度是什么:PyTorch 自动求导详解
人工智能·深度学习
Uopiasd1234oo3 小时前
上下文引导模块改进YOLOv26局部与全局特征融合能力双重提升
深度学习·yolo·机器学习
荒原之梦网4 小时前
大学应该开放吗?
考研·考研数学·荒原之梦考研数学
Jmayday5 小时前
Pytorch:CNN理论基础
人工智能·pytorch·cnn
动物园猫5 小时前
工业织物缺陷目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
ACCELERATOR_LLC5 小时前
【DataWhale组队学习】DIY-LLM Task6 评估与基准测试
人工智能·深度学习·大模型·模型评估
狮子座明仔6 小时前
ThinkTwice: 让模型学会“做完题再检查一遍“,推理+自纠错联合训练只加3%开销
大数据·人工智能·深度学习