卷积神经网络-填充+步长

Padding

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

f通常为奇数(会有中心点+ 好填充)
缺点:

1.多次卷积图像会变小

2.边缘的像素点 在f×f的卷积中覆盖的比较少,而中间的像素点会被多次覆盖到-》会丢失图像的边缘位置的信息

解决方法:

填充

例:在图像外侧填充一层像素,通常用0填充,原本6×6的图像填充成8×8的图像

这张图像在卷积后还是6×6的图像,则输出变成(n+2p-f+1)×(n+2p-f+1)的图像

Valid卷积

含义:不填充,p=0

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

Same卷积

填充后:输出大小和输入大小一样

填充p个像素点

(n+2p)×(n+2p)的图像 * f×f的图像=(n+2p-f+1)×(n+2p-f+1)

n+2p-f+1=n

p=(f-1)/2


例: 过滤器=5,p=(5-1)/2=2,填充两层-》输出图像和输入图像维数一致


卷积步长

例:

用7×7图像 * 3×3图像,步长=2

1.照样对左上角卷积,相加得到第一个数

2.过滤器跳过两个步长

向下移动(计算下面的行时)

公式:

  • n×n图像
  • 过滤器:f×f
  • 步长:s
  • padding:p
    最后卷积结果=[(n+2p-f)/s+1]×[(n+2p-f)/s+1]
    如果除不尽,向下取整,即如果覆盖框到了外面,,则不进行相乘操作

在例子中 s=2

(7+0-3)/2+1=2+1=3

所以最后输出结果是 3×3的图像

相关推荐
dundunmm3 分钟前
机器学习之KNN算法
人工智能·算法·机器学习·数据挖掘·knn·分类算法
deephub11 分钟前
LEC: 基于Transformer中间层隐藏状态的高效特征提取与内容安全分类方法
人工智能·深度学习·transformer·大语言模型·特征提取
Eric.Lee202116 分钟前
数据集-目标检测系列 车牌检测&识别 数据集 CCPD2019
人工智能·python·目标检测·计算机视觉·车牌识别·车牌检测·yolo检测
Hugging Face22 分钟前
欢迎 PaliGemma 2 – 来自 Google 的新视觉语言模型
人工智能·语言模型·自然语言处理
Bony-40 分钟前
基于卷积神经网络(CNN)和ResNet50的水果与蔬菜图像分类系统
人工智能·分类·cnn
UQI-LIUWJ1 小时前
datasets 笔记: 文本数据集的预处理(Tokenization)
人工智能·笔记·深度学习
架构师李肯1 小时前
【活动邀请·深圳】深圳COC社区 & 深圳 AWS UG 2024 re:Invent re:Cap
人工智能
Python机器学习AI1 小时前
融合机器学习算法:用VotingClassifier实现分类多模型的投票集成
人工智能·机器学习·分类
WeeJot嵌入式1 小时前
长短期记忆网络(LSTM):深度学习中的序列数据处理利器
人工智能·深度学习·lstm
梓羽玩Python1 小时前
字节黑科技 INFP,音频驱动的双边互动视频生成框架,实时生成,轻量又强大!
人工智能