【深度学习基础篇】手算卷积神经网络:13道经典题全解析(考研/面试必备)

【深度学习基础篇】手算卷积神经网络:13道经典题全解析(考研/面试必备)

卷积神经网络是深度学习的核心,而手算卷积尺寸和参数量是理解其原理的第一步。本文整理了13道经典手算题,先给出题目供读者自测,再提供详细解答和关键公式总结,帮助大家彻底掌握卷积计算。


一、基础单通道卷积(7题)

题目自测

  1. 现有特征图4×4,卷积核大小为2,卷出来的特征图多大?卷积核的参数量多少?
  2. 现有特征图4×4,卷积核大小为3,卷出来的特征图多大?
  3. 现有特征图4×4,卷积核大小为3,padding=1,卷出来的特征图多大?
  4. 现有特征图100×100,卷积核大小为3,卷出来的特征图多大?
  5. 现有特征图100×100,卷积核大小为3,padding=1,卷出来的特征图多大?
  6. 特征图8×8,卷积核大小为7,卷出来的特征图多大?这个卷积核的参数量多少?
  7. 特征图100×100,卷积核大小为7,卷出来的特征图多大?

二、进阶多通道卷积(6题)

题目自测

  1. 特征图100×100,卷积核大小为7,padding多少,特征图大小不变?
  2. 特征图224×224,卷积核大小为5,padding=2,卷出来的特征图多大?
  3. 特征图3×4×4,padding=1,卷积核数量1,卷出来的特征图为1×4×4。这套卷积核多大?卷积核的参数量多少?
  4. 特征图3×4×4,卷积核3×3×3,padding=1,卷积核数量7,卷出来的特征图多大?
  5. 特征图3×224×224,卷积核3×3×3,padding=1,卷积核数量64,卷出来的特征图多大?
  6. 特征图64×224×224,卷积核X×3×3,padding=1,卷积核数量128。卷出来的特征图多大?X是多少?这套卷积核的参数量多少?

三、详细解答和关键步骤

默认步长 stride = 1,输入通道数 C_in = 1(单通道)。

核心公式

  • 输出尺寸输出尺寸 = 输入尺寸 - 卷积核大小 + 2 × padding + 1
  • 参数量(单通道)参数量 = 卷积核大小 × 卷积核大小

(一)基础单通道卷积解答

  1. 特征图4×4,卷积核2×2,padding=0

    • 输出尺寸:4 - 2 + 0 + 1 = 33×3
    • 参数量:2 × 2 = 4
    • 关键:无padding时,直接套用基础公式。
  2. 特征图4×4,卷积核3×3,padding=0

    • 输出尺寸:4 - 3 + 0 + 1 = 22×2
    • 关键:注意卷积核不能超过特征图尺寸。
  3. 特征图4×4,卷积核3×3,padding=1

    • 输出尺寸:4 - 3 + 2×1 + 1 = 44×4
    • 关键 :当 padding = (卷积核大小 - 1) / 2 时,输出尺寸与输入尺寸相同。
  4. 特征图100×100,卷积核3×3,padding=0

    • 输出尺寸:100 - 3 + 0 + 1 = 9898×98
  5. 特征图100×100,卷积核3×3,padding=1

    • 输出尺寸:100 - 3 + 2×1 + 1 = 100100×100
    • 易错点 :容易忘记公式最后的 +1,导致算成99×99。
  6. 特征图8×8,卷积核7×7,padding=0

    • 输出尺寸:8 - 7 + 0 + 1 = 22×2
    • 参数量:7 × 7 = 49
  7. 特征图100×100,卷积核7×7,padding=0

    • 输出尺寸:100 - 7 + 0 + 1 = 9494×94

(二)进阶多通道卷积解答

核心公式:

  • 卷积核尺寸输入通道数 × 卷积核空间尺寸 × 卷积核空间尺寸 (如 3×3×3)
  • 参数量(多通道)参数量 = 输入通道数 × 卷积核空间尺寸 × 卷积核空间尺寸 × 输出通道数
  • 输出特征图输出通道数 × 输出空间尺寸 × 输出空间尺寸
  1. 特征图100×100,卷积核7×7,求padding使大小不变

    • 公式:padding = (卷积核大小 - 1) / 2
    • 计算:(7 - 1) / 2 = 3
    • 答案3
    • 关键:这是保持特征图尺寸不变的黄金法则。
  2. 特征图224×224,卷积核5×5,padding=2

    • 输出尺寸:224 - 5 + 2×2 + 1 = 224224×224
    • 验证padding = (5 - 1) / 2 = 2,符合尺寸不变法则。
  3. 特征图3×4×4,padding=1,卷积核数量1,输出1×4×4

    • 卷积核大小:输入通道数为3,空间尺寸需保持4×4,故卷积核为 3×3×3
    • 参数量:3 × 3 × 3 = 27
    • 关键:卷积核的输入通道数必须与输入特征图的通道数一致。
  4. 特征图3×4×4,卷积核3×3×3,padding=1,卷积核数量7

    • 空间尺寸:4 - 3 + 2×1 + 1 = 4
    • 输出特征图:7×4×4
  5. 特征图3×224×224,卷积核3×3×3,padding=1,卷积核数量64

    • 空间尺寸:224 - 3 + 2×1 + 1 = 224
    • 输出特征图:64×224×224
  6. 特征图64×224×224,卷积核X×3×3,padding=1,卷积核数量128

    • X的值:卷积核输入通道数必须等于输入特征图通道数,故 X = 64
    • 空间尺寸:224 - 3 + 2×1 + 1 = 224
    • 输出特征图:128×224×224
    • 参数量:64 × 3 × 3 × 128 = 73728

四、关键公式总结

场景 核心公式 备注
单通道输出尺寸 输出尺寸 = 输入尺寸 - K + 2P + 1 K=卷积核大小, P=padding, stride=1
多通道输出尺寸 与单通道公式相同 尺寸只与空间维度有关
单通道参数量 K × K 输入通道数为1
多通道参数量 C_in × K × K × C_out C_in=输入通道数, C_out=输出通道数
尺寸不变法则 P = (K - 1) / 2 当stride=1时,输出尺寸等于输入尺寸

五、学习复盘建议

  1. 牢记公式:输出尺寸和参数量的公式是基础,必须烂熟于心。
  2. 注意通道数:多通道卷积中,卷积核的输入通道数必须与输入特征图的通道数一致。
  3. 黄金法则padding = (K - 1) / 2 是保持尺寸不变的关键,在网络设计中非常常用。
  4. 多练手算:通过大量练习,培养对卷积计算的直觉,这对理解网络结构和排查问题非常有帮助。

本文由 [ppppppatrick] 整理,适合深度学习入门、考研复试和算法面试备考。如果对你有帮助,欢迎点赞、收藏、关注~

相关推荐
狮子座明仔2 小时前
REDSearcher:如何用30B参数的小模型,在深度搜索上击败GPT-o3和Gemini?
人工智能·gpt·深度学习·microsoft·语言模型·自然语言处理
万里鹏程转瞬至2 小时前
论文阅读 | SLA:sparse–linear attion视频生成95%稀疏度FLOPs降低20倍
论文阅读·深度学习·aigc
肾透侧视攻城狮3 小时前
《模型保存加载避坑指南:解锁SavedModel、HDF5与自定义对象的正确姿势》
深度学习·机器学习·tensorfl模型保存与加载·savedmodel 格式·hdf5 文件加载·选择性保存与加载·模型保存与加载高效化
2401_828890643 小时前
通用唤醒词识别模型 - Wav2Vec2
人工智能·python·深度学习·audiolm
gorgeous(๑>؂<๑)4 小时前
【ICLR26-Oral Paper-字节跳动】推理即表征:重新思考图像质量评估中的视觉强化学习
人工智能·深度学习·神经网络·机器学习·计算机视觉
狮子座明仔4 小时前
MemFly:当智能体的记忆学会了“断舍离“——信息瓶颈驱动的即时记忆优化
人工智能·深度学习·语言模型·自然语言处理
是小蟹呀^6 小时前
【论文比较】从 DeepSRC 到 BSSR:当“稀疏表示”遇上“深度学习”,算法是如何进化的?
深度学习·分类·deepsrc·bssr
挂科边缘17 小时前
YOLOv12环境配置,手把手教你使用YOLOv12训练自己的数据集和推理(附YOLOv12网络结构图),全文最详细教程
人工智能·深度学习·yolo·目标检测·计算机视觉·yolov12
deep_drink17 小时前
【论文精读(三)】PointMLP:大道至简,无需卷积与注意力的纯MLP点云网络 (ICLR 2022)
人工智能·pytorch·python·深度学习·3d·point cloud