卷积神经网络-填充+步长

Padding

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

f通常为奇数(会有中心点+ 好填充)
缺点:

1.多次卷积图像会变小

2.边缘的像素点 在f×f的卷积中覆盖的比较少,而中间的像素点会被多次覆盖到-》会丢失图像的边缘位置的信息

解决方法:

填充

例:在图像外侧填充一层像素,通常用0填充,原本6×6的图像填充成8×8的图像

这张图像在卷积后还是6×6的图像,则输出变成(n+2p-f+1)×(n+2p-f+1)的图像

Valid卷积

含义:不填充,p=0

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

Same卷积

填充后:输出大小和输入大小一样

填充p个像素点

(n+2p)×(n+2p)的图像 * f×f的图像=(n+2p-f+1)×(n+2p-f+1)

n+2p-f+1=n

p=(f-1)/2


例: 过滤器=5,p=(5-1)/2=2,填充两层-》输出图像和输入图像维数一致


卷积步长

例:

用7×7图像 * 3×3图像,步长=2

1.照样对左上角卷积,相加得到第一个数

2.过滤器跳过两个步长

向下移动(计算下面的行时)

公式:

  • n×n图像
  • 过滤器:f×f
  • 步长:s
  • padding:p
    最后卷积结果=[(n+2p-f)/s+1]×[(n+2p-f)/s+1]
    如果除不尽,向下取整,即如果覆盖框到了外面,,则不进行相乘操作

在例子中 s=2

(7+0-3)/2+1=2+1=3

所以最后输出结果是 3×3的图像

相关推荐
春末的南方城市1 小时前
CVPR 2026 | 加州大学 × Adobe 联合发布 FaceCam:无4D数据训练下实现单视频精准相机控制,让短视频创作者轻松掌控“电影级”运镜。
人工智能·深度学习·数码相机·机器学习·计算机视觉·aigc
℡終嚸♂6801 小时前
2026 实测:Codex 与 Claude 安装、cc-switch 配置及 API 管理全流程指南
人工智能
盟接之桥1 小时前
盟接之桥®:国产制造业EDI软件,为中国制造搭建安全连接之桥
大数据·网络·人工智能·低代码·重构·汽车·制造
未来之窗软件服务1 小时前
SenseVoicecpp ggml-webgpu大模型[AI人工智能(七十五)]—东方仙盟
c++·人工智能·算法·仙盟创梦ide·东方仙盟
咏&志1 小时前
目标检测之YOLOV2论文简读
人工智能·yolo·目标检测
梦梦代码精1 小时前
智能体编排 + MCP + 知识库,开源可商用!
人工智能·神经网络·gitee·开源·github·代码规范
HIT_Weston1 小时前
33、【Agent】【OpenCode】本地代理(智能适配层)
人工智能·agent·opencode
bryant_meng1 小时前
【VLA】Vision Language Action
人工智能·深度学习·rl·vla·世界模型·vlm
ZPC82101 小时前
ROS 2 手眼标定完整方案
人工智能·算法·性能优化·机器人
起个名字总是说已存在1 小时前
github开源AI技能:UI UX Pro Max智能设计系统生成器
人工智能·ui·开源·github