卷积神经网络-填充+步长

Padding

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

f通常为奇数(会有中心点+ 好填充)
缺点:

1.多次卷积图像会变小

2.边缘的像素点 在f×f的卷积中覆盖的比较少,而中间的像素点会被多次覆盖到-》会丢失图像的边缘位置的信息

解决方法:

填充

例:在图像外侧填充一层像素,通常用0填充,原本6×6的图像填充成8×8的图像

这张图像在卷积后还是6×6的图像,则输出变成(n+2p-f+1)×(n+2p-f+1)的图像

Valid卷积

含义:不填充,p=0

n×n的图像 * f×f的图像 = (n-f+1)×(n-f+1)

Same卷积

填充后:输出大小和输入大小一样

填充p个像素点

(n+2p)×(n+2p)的图像 * f×f的图像=(n+2p-f+1)×(n+2p-f+1)

n+2p-f+1=n

p=(f-1)/2


例: 过滤器=5,p=(5-1)/2=2,填充两层-》输出图像和输入图像维数一致


卷积步长

例:

用7×7图像 * 3×3图像,步长=2

1.照样对左上角卷积,相加得到第一个数

2.过滤器跳过两个步长

向下移动(计算下面的行时)

公式:

  • n×n图像
  • 过滤器:f×f
  • 步长:s
  • padding:p
    最后卷积结果=[(n+2p-f)/s+1]×[(n+2p-f)/s+1]
    如果除不尽,向下取整,即如果覆盖框到了外面,,则不进行相乘操作

在例子中 s=2

(7+0-3)/2+1=2+1=3

所以最后输出结果是 3×3的图像

相关推荐
光锥智能7 小时前
安克创新与飞书联合发布“安克 AI 录音豆” 手指可握仅重 10 克
人工智能·飞书
EkihzniY7 小时前
车牌相机:铁路桥安全防护的 “智慧眼睛”
人工智能
Blossom.1187 小时前
实时知识增强大模型:基于Flink的流式向量索引与动态RAG系统
大数据·运维·人工智能·python·flink·prompt·知识图谱
renhongxia17 小时前
数据可视化实战:用AI工具制作专业数据分析图表
人工智能·信息可视化·语言模型·自然语言处理·数据分析·制造
Allen_LVyingbo7 小时前
多智能体协作驱动的多模态医疗大模型系统:RAG–KAG双路径知识增强与架构的设计与验证(下)
人工智能·算法·架构·系统架构·知识图谱·健康医疗
badfl7 小时前
Sora AI漫剧教程入门指南:提示词生成分镜结构与Sora一键生成
人工智能·ai·视频
光影少年7 小时前
前端如何开发ai生成图片及流式回答
前端·人工智能·langchain
shangjian0077 小时前
AI大模型-深度学习-常见问题和解决方案
人工智能·深度学习
wfeqhfxz25887827 小时前
【计算机视觉】基于Libra-Faster R-CNN的膝盖与腿部区域目标检测模型优化_1
计算机视觉·r语言·cnn
Mr.Winter`7 小时前
轨迹优化 | 微分动态规划DDP与迭代线性二次型调节器iLQR理论推导
人工智能·算法·机器人·自动驾驶·动态规划·ros·具身智能