卷积神经网络

目录

激活函数

卷积神经网络-padding

卷积神经网络-Stride

[卷积神经网络-3D 卷积](#卷积神经网络-3D 卷积)

卷积神经网络-一个卷积层示例

卷积神经网络-Pooling

参数和超参数

过拟合、梯度消失与爆炸

Batch与miniBatch

[Batch Normalization](#Batch Normalization)

ResNet

UNet


激活函数

隐藏层只能使用非线性激活函数,不能使用线性,
因为不管多少个线性函数组合得到还是个线性函数。
Sigmoid激活函数-二分类
其它基本都用ReLU,因为它的斜率基本
不会为0所以学习速率比较快

卷积神经网络-padding

可以解决卷积过程遇到的问题:

  • 输出图像缩小,如果每层都减小经过比如100层图像
    会变得非常小
  • 图像边缘大部分信息都被丢失了
    加入Padding后,卷积后图像大小计算公式:
    输入:n x n 卷积核大小f x f Padding 大小为p
    则输出: (n+2p-f+1) x (n+2p-f+1)

卷积神经网络-Stride

Strided Convolution:
卷积过程中,不是逐像素,而是有个步长如右图所示。
计算大小
公式如下,如果得到的大小不是整数,则向下取整也就
是只有滤波器完全覆盖在图像上才能计算

卷积神经网络-3D 卷积

3D Convolution:
➢ 当输入的通道数大于 1 时例如 3 ,滤波器的通道数与输入保持
一致为 3 ,所以计算的过程中如右图所示,卷积的时候是
3x3x3 共 27 个参数计算然后加和得到的结果是当前像素卷积
后的值。
➢ 也可以实现多个滤波器进行卷积,滤波器的个数决定了输出
的图像的通道数。

卷积神经网络-一个卷积层示例

参数计算 :
➢ 当输入的通道数与滤波器的通道数相同
➢ 滤波器的个数与输出的通道数相同
➢ 权重参数 w= 滤波器大小与输入和输出通道数乘积
➢ 偏置 b= 滤波器个数即输出通道的个数

**卷积神经网络-**Pooling

在卷积神经网络中通常会在相邻的卷积层之间加入一个池化层,
1. 特征不变性( feature invariant
使模型更关注是否存在某些特征而不是特征具体的位置可看作
是一种很强的先验,使特征学习包含某种程度自由度,能容忍
一些特征微小的位移
2. 特征降维
降采样作用,从而使模型可以抽取更广范围的特征同时减小了
下一层输入大小,进而减小计算量和参数个数
3. 在一定程度上能防止过拟合的发生
a. 池化前后不改变通道数,池化后图像大小计
算方式与卷积相同
b. 用到的超参数就是 filter 和 stride (常用
f=2,s=2 相当于图像减半,或者 f=3,s=2 ),很
少用到 padding
c. 池化过程中没有需要学习的参数

参数和超参数

➢ 参数:需要网络学习的参数: w b
➢ 超参数:模型训练需要的外部设置的参数比
如学习率迭代次数,隐藏层的层数,激活函
数的选择等
➢ 找到最优的超参数方法就是不断尝试

过拟合、梯度消失与爆炸

过拟合解决办法 :
➢ 正则化
➢ 数据增强
➢ Dropout
➢ Early stopping

BatchminiBatch

Batch gradient descent
➢ 遍历全部数据集算一次损失函数,然后算函
数对各个参数的梯度,更新梯度。
➢ 计算量开销大,计算速度慢,不支持在线学

Mini-batch gradient decent :
➢ 小批的梯度下降,这种方法把数据分为若干个批,
按批来更新参数,这样,一个批中的一组数据共
同决定了本次梯度的方向,下降起来就不容易跑
偏,减少了随机性。
➢ 另一方面因为批的样本数与整个数据集相比小了
很多,计算量也不是很大。

Batch Normalization

➢ 2015年由 Google 提出,开 Normalization 之先
河。其规范化针对单个神经元进行,利用网
络训练时一个 mini-batch 的数据来计算该神经
元的均值和方差 , 因而称为 Batch Normalization
➢ 正则化,帮助模型快速收敛
➢ 防止梯度爆炸或消失

ResNet

➢ 虚线残差块,仅在conv3_1, conv4_1,conv5_1中使用,
目的是调整特征矩阵的深度和大小
➢ 在深层网络(50,101,152)中除了上面提到的
在conv2_1也会使用虚线残差块仅调整特征的深度

UNet

➢ 全卷积神经网络,对称的U型
➢ 主要用于医学图像分割
➢ 左半边:将图像->高语义feature map的过程
看成编码器
➢ 右半边:高语义->像素级别的分类score map
的过程看作解码器

相关推荐
带娃的IT创业者1 分钟前
US Cities Are Axing Flock Safety Surveillance Technology: 当监控之眼被蒙上,我们在守护什么?
人工智能·智慧城市·数据治理·公共安全·隐私保护·监控技术·技术伦理
愚公搬代码2 分钟前
【愚公系列】《AI漫剧创作一本通》004-剧本拆解,把小说改编为可落地的脚本(爆款AI漫剧,从选择合适的小说开始)
人工智能·ai漫剧
玩转单片机与嵌入式4 分钟前
学习嵌入式AI(TInyML),只需掌握这点python基础即可!
人工智能·python·学习
mit6.8249 分钟前
从 Vibe Coding 到 Agentic Engineering
人工智能
kay_54514 分钟前
YOLO26改进| 主干网络 | 提升长距离特征建模与全局上下文理解能力【CVPR】
人工智能·目标检测·计算机视觉·目标跟踪·论文·yolo26·yolo26改进
ting945200017 分钟前
Huddle01 VMs 支持 AI 助手一键部署,MCP 协议重塑云基础设施管理
人工智能
地理探险家17 分钟前
我整理了一份动物数据集合集,做深度学习的直接省掉80%时间(附使用建议)
人工智能·深度学习·数据集·图像·动物
硅谷秋水24 分钟前
语言智体的Harness工程:Harness层作为控制、智体和运行时
人工智能·深度学习·机器学习·语言模型
老黄编程26 分钟前
大型工地实时数据处理与三维重构系统方案(极简中心化部署版)
人工智能·数码相机·计算机视觉·大数据处理·入侵检测·三维重构
狙击主力投资工具34 分钟前
26年5月4日本周复盘总结,好票机会,下周大盘方向,热门板块方向,操作建议,实用干货
人工智能·区块链