深度学习入门(三):卷积神经网络(CNN)

引入

给定一张图片,计算机需要模型判断图里的东西是什么?

(car、truck、airplane、ship、horse)

一、卷积神经网络整体架构

  • CONV:卷积计算层,线性乘积求和
  • RELU:激励层,激活函数
  • POOL:池化层,取区域平均或最大(MAX POOL)
  • PC:全连接层

二、CONV卷积层计算

对CNN来说,它是一块一块进行对比的,"小块"称之为Features特征。卷积就是对图像(不同窗口数据)和滤波矩阵做内积 。每计算完一个数据窗口内的数据后,数据窗口不断平滑移动,直到计算完所有数据。

图中矩阵解析:

  • Input Volume(7x7x3):图像的长宽均为7,3代表RGB三个颜色通道
  • Filter W0、W1:滤波器,带一组固定权重的神经元
  • Output Volume:两个不同的输出

随着左边数据窗口的平移滑动,滤波器 F i l t e r W 0 / W 1 Filter W0/W1 FilterW0/W1对不同的局部数据进行卷积计算。左边数据在变化,每次滤波器都是针对某一局部的数据窗口进行卷积 ,这就是所谓的CNN中的局部感知机制 。与此同时,数据窗口滑动,导致输入在变化,但中间滤波器Filter w0的权重是固定不变 的,这个权重不变即所谓的CNN中的参数(权重)共享机制

三、卷积层参数

  • depth:神经元个数,滤波器个数
  • stride:步长,滑动多少步到边缘
  • zero-padding:边缘填充,为了总长能为步长整除,并且一定程度上减轻边界利用少的情况

四、ReLU激励层

五、POOL池化层

进行筛选压缩的过程,取区域平均或最大

最大池化 MAX POOLING

下图包含两次卷积一次池化,共7层神经网络

六、特征图变化

三维要拉长成特征向量,再输入全接连层

相关推荐
陈大鱼头6 小时前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模6 小时前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能6 小时前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤6 小时前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人6 小时前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点6 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若1237 小时前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python
七牛云行业应用7 小时前
GPT-5.4能力前瞻:解析原生电脑操控(Computer Use)原理与Agent架构构建
人工智能·chatgpt·大语言模型·ai agent·mcp协议
带娃的IT创业者7 小时前
Prompt Engineering 进阶:让 AI 写出人类味道(完整指南)
人工智能·大模型·llm·prompt·写作技巧·ai 教学
简佐义的博客7 小时前
转录组数据分析实战,仅需99元(视频版)
大数据·人工智能·数据挖掘·数据分析·音视频