卷积神经网络(CNN)

大家好,这里是七七,今天来更新关于CNN相关的内容同了。本文是针对CNN原理的说明,但对于小白不是非常友好,建议先掌握神经网络相应知识再进行阅读哦。


一、卷积与互相关

卷积

卷积运算是对两个函数进行的一种数学运算,结果是一个新的函数,如果第一个函数为f(x),第二个为g(x),那么其卷积运算被定义为

对于这种运算,如果用手算的话,我们一般先画出f(t),再画出g(t),然后再对g(t)沿y轴翻过去变为g(-t),然后根据偏移量x来进行平移,最后再相乘,就可以得到对应点的卷积值了

值得一提的是,卷积运算满足交换律

互相关

互相关运算与卷积运算极为相似,其公式是这样的

计算过程同上,不再赘述。

值得一提的是,互相关运算不满足交换律

二、卷积核与特征映射图

在图像处理领域中,我们经常使用卷积神经网络(CNN)来进行处理。一般来说,用卷积操作或互相关操作,两者的作用是完全相同的。但出于算法简便性考虑,一般用互相关运算。其实很多神经网络平台提供的库函数中所使用的就是互相关而非卷积,但习惯地称之为卷积。

再用CNN处理图像时,待处理的图像称之为输入,并表示为一个二元离散函数f(m,n)。为了从图片中提取出来特征,我们还需要另一个函数与图像进行卷积,从而提取出相应的特征,而对应的函数就是卷积核,或核函数g(n,m)。卷积的结果是一个新的二元离散函数,被称为特征映射图。这一过程被称为特征提取。

三、CNN的一般结构

  1. 在第二部介绍过特征提取物过程,就是用核函数与原始数据进行卷积,从而提取出特征。
  2. 下一步就是用激活函数对特征映射图进行非线性处理,如把小于0的数据都变为0。
  3. 接着就是采用池化函数分别对特征图进行池化,原理就是使用图像中某个位置及其周边相邻位置的总体统计特征来代替该位置的取值。可以采用最大池化、平均池化等一系列方法。池化的目的是亚索图像的尺寸,凸显特征。
  4. 最后呢,就是需要将池化后的数据展开为1维的数据,然后投入MLP中进行训练。

在这一过程中,也有一些术语,这里简要介绍一下

  • 卷积级:将原始图像与核函数进行卷积这一过程
  • 探测级:用激活函数对特征映射图进行非线性处理
  • 池化级:池化这一过程
  • 卷积层:卷积级、探测级、池化级合起来

因此呢,框架也就基本确定了,CNN的一般架构在大的层面上可分为卷积层+MLP层。其中卷积层权值不变,MLP层权值会改变。

当然,也可以设立很多个卷积层1、卷积层2......;卷积层中也可能存在某些带训练的参数(如偏移量)。

三、边界策略和池化

边界策略

一般来说,输入图像的尺寸远大于核函数的尺寸,而特征图的尺寸不仅取决于原始尺寸和核函数,与边界策略也有关系。

所幸的是,边界策略一般不是那么重要,因为一般来说,图像的特征更多会集中在中心,与边界关系不大

池化

这里比较重要的是步幅,就是每次池化窗口移动的距离。最为常见的情况是等于池化窗口边长-1。

池化还有一个很重要的特征,就是对局部微小位移的不变性。也就是说,被池化的图像中所有像素或部分像素发生了微小位移后,池化的结果并不会发生改变。

相关推荐
卧式纯绿5 分钟前
每日文献(八)——Part one
人工智能·yolo·目标检测·计算机视觉·目标跟踪·cnn
巷95512 分钟前
OpenCV图像形态学:原理、操作与应用详解
人工智能·opencv·计算机视觉
深蓝易网41 分钟前
为什么制造企业需要用MES管理系统升级改造车间
大数据·运维·人工智能·制造·devops
xiangzhihong81 小时前
Amodal3R ,南洋理工推出的 3D 生成模型
人工智能·深度学习·计算机视觉
狂奔solar1 小时前
diffusion-vas 提升遮挡区域的分割精度
人工智能·深度学习
资源大全免费分享1 小时前
MacOS 的 AI Agent 新星,本地沙盒驱动,解锁 macOS 操作新体验!
人工智能·macos·策略模式
跳跳糖炒酸奶2 小时前
第四章、Isaacsim在GUI中构建机器人(2):组装一个简单的机器人
人工智能·python·算法·ubuntu·机器人
AI.NET 极客圈2 小时前
AI与.NET技术实操系列(四):使用 Semantic Kernel 和 DeepSeek 构建AI应用
人工智能·.net
Debroon2 小时前
应华为 AI 医疗军团之战,各方动态和反应
人工智能·华为
俊哥V2 小时前
阿里通义千问发布全模态开源大模型Qwen2.5-Omni-7B
人工智能·ai