卷积神经网络-填充+步长

Padding

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

f通常为奇数(会有中心点+ 好填充)
缺点:

1.多次卷积图像会变小

2.边缘的像素点 在f×f的卷积中覆盖的比较少,而中间的像素点会被多次覆盖到-》会丢失图像的边缘位置的信息

解决方法:

填充

例:在图像外侧填充一层像素,通常用0填充,原本6×6的图像填充成8×8的图像

这张图像在卷积后还是6×6的图像,则输出变成(n+2p-f+1)×(n+2p-f+1)的图像

Valid卷积

含义:不填充,p=0

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

Same卷积

填充后:输出大小和输入大小一样

填充p个像素点

(n+2p)×(n+2p)的图像 * f×f的图像=(n+2p-f+1)×(n+2p-f+1)

n+2p-f+1=n

p=(f-1)/2


例: 过滤器=5,p=(5-1)/2=2,填充两层-》输出图像和输入图像维数一致


卷积步长

例:

用7×7图像 * 3×3图像,步长=2

1.照样对左上角卷积,相加得到第一个数

2.过滤器跳过两个步长

向下移动(计算下面的行时)

公式:

  • n×n图像
  • 过滤器:f×f
  • 步长:s
  • padding:p
    最后卷积结果=[(n+2p-f)/s+1]×[(n+2p-f)/s+1]
    如果除不尽,向下取整,即如果覆盖框到了外面,,则不进行相乘操作

在例子中 s=2

(7+0-3)/2+1=2+1=3

所以最后输出结果是 3×3的图像

相关推荐
闵孚龙1 天前
Claude Code 技能系统全解析:AI Agent 自定义能力、SKILL.md、MCP 扩展、上下文预算与企业级自动化落地
运维·人工智能·自动化
Gigavision1 天前
SEED-VII 数据集介绍:面向七类情绪识别的 EEG 与眼动多模态数据集
人工智能·python·算法·脑机接口
InfiSight智睿视界1 天前
AI 视频分析的边界在哪里?从画面识别到时空行为理解的系统设计思路
人工智能·ai视频工作流·连锁门店管理
byzh_rc1 天前
[自然语言处理-入门] 语音转换VC
人工智能·自然语言处理
weixin_553654481 天前
如何看待 2026 年 Google I/O 大会发布的 Gemini Spark?
大数据·人工智能·分布式·spark
海兰1 天前
【第56篇】Graph Example —— MCP-Node 模块
java·人工智能·spring boot·spring ai
KaMeidebaby1 天前
卡梅德生物技术快报|Fab 抗体文库构建标准化实验流程与数据复盘
服务器·前端·数据库·人工智能·算法
想你依然心痛1 天前
HarmonyOS 6(API 23)实战:基于悬浮导航、沉浸光感与HMAF的“直播智脑“——PC端AI智能体电商直播中控台
人工智能·华为·harmonyos
qcx231 天前
【AI Daily】每日AI日报
人工智能·llm·agent·daily
2zcode1 天前
基于深度学习与STM32的野猪检测与预警系统
人工智能·stm32·深度学习·野猪检测