CNN卷积理解

1 卷积的步骤

1 过滤器(卷积核)(Filter或Kernel)

卷积层使用一组可学习的过滤器来扫描输入数据(通常是图像)。每个过滤器都是一个小的窗口,包含一些权重,这些权重通过训练数据进行学习。

过滤器的大小(例如3x3或5x5)决定了它观察输入数据的范围大小。较小的过滤器可以捕捉到细粒度的特征,而较大的过滤器可以捕捉到更大范围的特征。

每一个卷积核(或过滤器)通常被设计用来从输入图像中提取某类特征。

2 特征图(Feature Map)

当过滤器在输入数据上滑动(或卷积)时,它会计算过滤器与输入数据的局部区域之间的点乘积,生成特征图。每个特征图代表了过滤器检测到的特定类型的特征在输入数据中的位置。

例如,在处理图像时,一个过滤器可能专门用来检测边缘,另一个过滤器可能用来检测纹理。

3 步长(Stride)

步长决定了过滤器移动的间隔。步长为1意味着过滤器每次移动一个像素,步长为2则意味着每次移动两个像素。

步长的大小影响特征图的空间维度,步长较大会导致特征图的尺寸减小。

4 填充(Padding)

**为了保持特征图的尺寸不受过滤器大小的影响,或者为了防止边界信息丢失,可以在输入数据周围添加填充。**常见的填充方式有"valid"(不添加填充)和"same"(添加填充以保持尺寸不变)。

5 激活函数

卷积操作后通常会应用一个非线性激活函数,如ReLU(Rectified Linear Unit),以增加网络的非线性能力,使其能够学习更复杂的特征。

6 权重共享

在整个输入数据上,同一个过滤器的权重是共享的,这意味着无论过滤器在哪个位置,它都使用相同的权重。这使得CNN在参数数量上更加高效,同时也赋予了模型某种平移不变性。

2 卷积的例子

其中,新图像大小计算公式

CONV过程参考: 卷积运算的动态演示:

https://cs231n.github.io/assets/conv-demo/index.html

3 一些机制

局部感知主要是通过卷积核来实现的。在卷积神经网络(CNN)中,每个卷积核负责提取输入数据(如图像)的一种特定局部特征。这里的局部特征可以是图像的边缘、角点、纹理或者更抽象的模式。

参数共享机制就是说,在同一卷积层中,一个卷积核的权重在整个输入数据上共享。这不仅减少了模型的参数量,也使得模型对输入数据的局部区域具有更高的敏感度。

相关推荐
君为先-bey2 小时前
CogVideoX——Transformer从文本到视频的扩散模型
深度学习·音视频·transformer·扩散模型
青风973 小时前
SDDGR:基于稳定扩散的深度生成重放,用于类增量对象检测(CVPR 2024)
网络·人工智能·深度学习·神经网络·计算机视觉
忆~遂愿3 小时前
《大模型驱动软件测试》| 软件工程3.0时代,大模型驱动测试实战指南
人工智能·深度学习·神经网络·机器学习·自然语言处理·软件工程·知识图谱
这是谁的博客?4 小时前
Mamba 状态空间模型深度解析:挑战 Transformer 的新一代架构
深度学习·ai·架构·transformer·ssm·mamba·状态空间模型
极光代码工作室6 小时前
基于机器学习的二手商品价格预测系统
人工智能·python·深度学习·机器学习
生成论实验室6 小时前
我们给AI装上了判断力
人工智能·深度学习·语言模型·机器人·自动驾驶
YOLO数据集集合7 小时前
智慧道路病害分割识别|公路裂缝坑洞智能检测 无人机巡检深度学习数据集
人工智能·深度学习·无人机
AndrewHZ8 小时前
【大模型技术博客】什么是大语言模型(LLM)?从零认识AI新范式
人工智能·深度学习·ai·语言模型·大模型·llm·transformer
AI医影跨模态组学9 小时前
Nat. Biomed. Eng(1区top,IF=26.6)上海科技大学钱学军团队:一种用于乳腺癌风险分层的多模态机器学习模型
人工智能·科技·深度学习·机器学习·论文·医学影像
十年一梦惊觉醒9 小时前
BERT模型应用智能客服方案
人工智能·深度学习·bert