卷积神经网络-填充+步长

Padding

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

f通常为奇数(会有中心点+ 好填充)
缺点:

1.多次卷积图像会变小

2.边缘的像素点 在f×f的卷积中覆盖的比较少,而中间的像素点会被多次覆盖到-》会丢失图像的边缘位置的信息

解决方法:

填充

例:在图像外侧填充一层像素,通常用0填充,原本6×6的图像填充成8×8的图像

这张图像在卷积后还是6×6的图像,则输出变成(n+2p-f+1)×(n+2p-f+1)的图像

Valid卷积

含义:不填充,p=0

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

Same卷积

填充后:输出大小和输入大小一样

填充p个像素点

(n+2p)×(n+2p)的图像 * f×f的图像=(n+2p-f+1)×(n+2p-f+1)

n+2p-f+1=n

p=(f-1)/2


例: 过滤器=5,p=(5-1)/2=2,填充两层-》输出图像和输入图像维数一致


卷积步长

例:

用7×7图像 * 3×3图像,步长=2

1.照样对左上角卷积,相加得到第一个数

2.过滤器跳过两个步长

向下移动(计算下面的行时)

公式:

  • n×n图像
  • 过滤器:f×f
  • 步长:s
  • padding:p
    最后卷积结果=(n+2p-f)/s+1×(n+2p-f)/s+1
    如果除不尽,向下取整,即如果覆盖框到了外面,,则不进行相乘操作

在例子中 s=2

(7+0-3)/2+1=2+1=3

所以最后输出结果是 3×3的图像

相关推荐
doiito(Do It Together)2 分钟前
我用 Rust 写了个 AI 媒体管家:Gliding Horse 赋能 media_agent,目标是让 ComfyUI 工作流彻底自动化
人工智能·架构·rust·媒体
qcx233 分钟前
Agentic RAG不止能回答问题,已经能自动修复真实CVE漏洞了
人工智能·机器学习·ai·llm·脑信号
用户39483951075535 分钟前
用一个 MCP 给你的 AI 装上长期记忆——从原理到配置全流程
人工智能
TanYYF16 分钟前
spring ai入门教程一
java·人工智能·spring
jaychouchannel20 分钟前
RecursiveCharacterTextSplitter 中文切分隐形缺陷:重叠、断语义、列表割裂完整复现与修复
人工智能·机器学习
用户9385156350722 分钟前
手把手教你实现一个 MCP 文件读取服务器:从协议到代码的深度解析
javascript·人工智能
matlab代码27 分钟前
基于CNN卷积神经网络手写汉字识别系统 (GUI界面)【源码38期】
人工智能·神经网络·cnn·汉字识别
用户9385156350728 分钟前
RAG 实战:从零搭建语义搜索系统,彻底告别关键词匹配的尴尬
javascript·人工智能
EMA30 分钟前
Rag中Query改写的实践方案总结
人工智能
阿部多瑞 ABU31 分钟前
论“轻小说”之异化
人工智能