【计算机视觉基础】卷积

卷积是什么?

卷积怎么操作的?

为什么会形成特征提取?

1*1卷积核为什么可以整理通道数?

这篇文章将会解决这些问题------

1 卷积是什么?

提取特征需要两个矩阵,一张是原图,一个是卷积核。卷积就是代表卷积核的矩阵点乘表示图像的矩阵的过程,局部点乘,求和得到特征值。

2 卷积怎么操作的?

圈1表示一张rgb图片,经过四个卷积核卷积后得到四张特征图,共同组成一个新的特征图。

圈2表示另一张图(方便理解)

3 为什么会形成特征提取?

这部分这位老师讲的非常清晰明了https://www.bilibili.com/video/BV1cL4y1F7Ss?spm_id_from=333.788.videopod.sections\&vd_source=98026f4382fb1617a0f9a68127377cbb

简单来说就是一个卷积层中包含多个卷积核,每个卷积核都用来识别不同的特征,得到一个特征值,如果最后得到的特征值一样就说明它提取到的信息是一类,或者说它卷积的那块区域是这个目标对象。

4 1*1卷积核为什么可以整理通道数?

如下图所示。

优点:
通道压缩与扩展 :1x1卷积可以调整特征图的通道数,即可以通过过滤器的数量来减少或增加特征图的通道。这使得网络能够学习如何从多个通道中提取相关信息。
特征融合 :通过使用1x1卷积,网络能够对同一空间位置的多个通道之间进行加权求和,从而实现特征融合。这样不仅可以捕捉不同通道之间的关系,还可以通过加权组合得到更有判别力的特征。
非线性变换 :在1x1卷积后,可以应用非线性激活函数(如ReLU),这使得网络能够学习到更加复杂的通道间关系而不仅仅是线性组合。
效率:相较于更大的卷积核,1x1卷积计算效率高,因为它只在通道维度上进行卷积,减少了计算量,但依然保留了重要的通道信息。

在深度学习中的角色:1x1卷积在诸如Inception模块和残差网络中的应用,进一步展示了它对捕捉通道相关性的重要性。这些模块中,1x1卷积起到了桥梁的作用,使得不同的卷积层能有效地组合特征。

5 案例

两个3*3卷积核对两个rgb图像是怎么提取特征的

相关推荐
Morpheon3 分钟前
循环神经网络(RNN):从理论到翻译
人工智能·rnn·深度学习·循环神经网络
量子位7 分钟前
6 分钟狂掉 750 亿市值!苹果发布会发啥了…
人工智能·ai编程
Gyoku Mint12 分钟前
机器学习×第五卷:线性回归入门——她不再模仿,而开始试着理解你
人工智能·python·算法·机器学习·pycharm·回归·线性回归
机器之心14 分钟前
刚刚,苹果WWDC掀AI重构风暴!端侧模型全开放、AI版Siri却成最大「鸽」王
人工智能
Blossom.11817 分钟前
基于机器学习的智能故障预测系统:构建与优化
人工智能·python·深度学习·神经网络·机器学习·分类·tensorflow
DisonTangor33 分钟前
【字节拥抱开源】字节团队开源视频模型 ContentV: 有限算力下的视频生成模型高效训练
人工智能·开源·aigc
吴声子夜歌42 分钟前
OpenCV——图像基本操作(一)
python·opencv·计算机视觉
春末的南方城市1 小时前
腾讯开源视频生成工具 HunyuanVideo-Avatar,上传一张图+一段音频,就能让图中的人物、动物甚至虚拟角色“活”过来,开口说话、唱歌、演相声!
人工智能·计算机视觉·自然语言处理·aigc·音视频·视频生成
UQI-LIUWJ1 小时前
论文笔记:Urban Computing in the Era of Large Language Models
人工智能·语言模型·自然语言处理
张较瘦_1 小时前
[论文阅读] 人工智能+软件工程 | MemFL:给大模型装上“项目记忆”,让软件故障定位又快又准
论文阅读·人工智能·软件工程