深度学习入门(三):卷积神经网络(CNN)

引入

给定一张图片,计算机需要模型判断图里的东西是什么?

(car、truck、airplane、ship、horse)

一、卷积神经网络整体架构

  • CONV:卷积计算层,线性乘积求和
  • RELU:激励层,激活函数
  • POOL:池化层,取区域平均或最大(MAX POOL)
  • PC:全连接层

二、CONV卷积层计算

对CNN来说,它是一块一块进行对比的,"小块"称之为Features特征。卷积就是对图像(不同窗口数据)和滤波矩阵做内积 。每计算完一个数据窗口内的数据后,数据窗口不断平滑移动,直到计算完所有数据。

图中矩阵解析:

  • Input Volume(7x7x3):图像的长宽均为7,3代表RGB三个颜色通道
  • Filter W0、W1:滤波器,带一组固定权重的神经元
  • Output Volume:两个不同的输出

随着左边数据窗口的平移滑动,滤波器 F i l t e r W 0 / W 1 Filter W0/W1 FilterW0/W1对不同的局部数据进行卷积计算。左边数据在变化,每次滤波器都是针对某一局部的数据窗口进行卷积 ,这就是所谓的CNN中的局部感知机制 。与此同时,数据窗口滑动,导致输入在变化,但中间滤波器Filter w0的权重是固定不变 的,这个权重不变即所谓的CNN中的参数(权重)共享机制

三、卷积层参数

  • depth:神经元个数,滤波器个数
  • stride:步长,滑动多少步到边缘
  • zero-padding:边缘填充,为了总长能为步长整除,并且一定程度上减轻边界利用少的情况

四、ReLU激励层

五、POOL池化层

进行筛选压缩的过程,取区域平均或最大

最大池化 MAX POOLING

下图包含两次卷积一次池化,共7层神经网络

六、特征图变化

三维要拉长成特征向量,再输入全接连层

相关推荐
lijianhua_97128 小时前
国内某顶级大学内部用的ai自动生成论文的提示词
人工智能
EDPJ8 小时前
当图像与文本 “各说各话” —— CLIP 中的模态鸿沟与对象偏向
深度学习·计算机视觉
蔡俊锋8 小时前
用AI实现乐高式大型可插拔系统的技术方案
人工智能·ai工程·ai原子能力·ai乐高工程
自然语8 小时前
人工智能之数字生命 认知架构白皮书 第7章
人工智能·架构
大熊背8 小时前
利用ISP离线模式进行分块LSC校正的方法
人工智能·算法·机器学习
eastyuxiao9 小时前
如何在不同的机器上运行多个OpenClaw实例?
人工智能·git·架构·github·php
诸葛务农9 小时前
AGI 主要技术路径及核心技术:归一融合及未来之路5
大数据·人工智能
光影少年9 小时前
AI Agent智能体开发
人工智能·aigc·ai编程
ai生成式引擎优化技术9 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI生成式引擎(GEO)技术白皮书
人工智能
帐篷Li9 小时前
9Router:开源AI路由网关的架构设计与技术实现深度解析
人工智能