卷积神经网络-填充+步长

Padding

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

f通常为奇数(会有中心点+ 好填充)
缺点:

1.多次卷积图像会变小

2.边缘的像素点 在f×f的卷积中覆盖的比较少,而中间的像素点会被多次覆盖到-》会丢失图像的边缘位置的信息

解决方法:

填充

例:在图像外侧填充一层像素,通常用0填充,原本6×6的图像填充成8×8的图像

这张图像在卷积后还是6×6的图像,则输出变成(n+2p-f+1)×(n+2p-f+1)的图像

Valid卷积

含义:不填充,p=0

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

Same卷积

填充后:输出大小和输入大小一样

填充p个像素点

(n+2p)×(n+2p)的图像 * f×f的图像=(n+2p-f+1)×(n+2p-f+1)

n+2p-f+1=n

p=(f-1)/2


例: 过滤器=5,p=(5-1)/2=2,填充两层-》输出图像和输入图像维数一致


卷积步长

例:

用7×7图像 * 3×3图像,步长=2

1.照样对左上角卷积,相加得到第一个数

2.过滤器跳过两个步长

向下移动(计算下面的行时)

公式:

  • n×n图像
  • 过滤器:f×f
  • 步长:s
  • padding:p
    最后卷积结果=[(n+2p-f)/s+1]×[(n+2p-f)/s+1]
    如果除不尽,向下取整,即如果覆盖框到了外面,,则不进行相乘操作

在例子中 s=2

(7+0-3)/2+1=2+1=3

所以最后输出结果是 3×3的图像

相关推荐
卢锡荣几秒前
LDR6500|超小封装 Type‑C DRP PD 控制芯片:边充边传,一芯极简,全能适配
开发语言·网络·人工智能·计算机外设·电脑
信道者1 分钟前
中国收紧AI“缰绳”:OpenClaw遭银行及政府机构限制使用
人工智能
格林威5 分钟前
工业相机图像高速存储(C#版):直接IO存储方法,附海康相机C#实战代码!
开发语言·人工智能·数码相机·c#·工业相机·海康相机·堡盟相机
belldeep5 分钟前
AI 引擎 : MiroFish AI智能体项目介绍
人工智能·ai·agent·预测·mirofish
csdn_aspnet8 分钟前
使用 Ollama,通过 C#、语义内核和 Google Gemma 3 构建本地 AI 代理
人工智能·ai·c#·ollama·gemma
装不满的克莱因瓶9 分钟前
【从零搭建】SpringAI Alibaba + RAG + Milvus + Qwen 项目实战
人工智能·ai·大模型·milvus·rag·springai·向量库
爱打代码的小林9 分钟前
基于 OpenCV 实现实时目标跟踪:CSRT 跟踪器
人工智能·opencv·目标跟踪
主机哥哥10 分钟前
OpenClaw:让 AI 替你干活!基础定义 + 功能场景 + 部署教程
人工智能·openclaw·openclaw部署·openclaw安装
BIST12 分钟前
ICML 2025 | 仅需 6.5% 显存!GS-Bias:高效视觉语言模型测试时自适应新范式
人工智能·深度学习·机器学习·计算机视觉
H Journey13 分钟前
学习OpenCV之HSV 颜色模式
人工智能·opencv·学习·hsv