【深度学习】CNN卷积神经网络基础

一、发展历程

只要包含了卷积层的网络都可以理解为卷积神经网络。

二、全连接层

神经元按列进行排列,并列与列的神经元进行全连接 ,就可以的得到BP神经网络。

eg:利用BP神经网络做车牌数字识别

将5*5的矩阵按行展开,并拼接成一个行向量,此时就可以将该行向量作为输入层

输出层期望:

训练:

三、卷积层

(一)卷积

卷积:滑动窗口在特征图进行滑动并计算。

目的:进行特征提取

卷积特性:拥有局部感知机制(以滑动窗口的形式进行计算),权值共享(滑动过程中窗口的值不会发生改变)。

普通神经网络:体量过大

多维(通道)特征向量做卷积操作,深度(通道channel)保持一致,如正常特征图RGB三个维度,那么卷积核理应保持三个维度。将每个维度的卷积核放到对应的维度上做卷积操作,最后求和。

  • 卷积核的channel与输入特征层的channel相同
  • 输出的特征矩阵channel与卷积核个数相同
  • bias偏移量:输出的特征矩阵直接和偏移量相加
  • 加上激活函数如何计算?

(二)激活函数

在计算过程中是一个线性的计算过程,为了使其具备非线性的计算能力。

(三)卷积计算越界处理

一般情况下在上下左右都补0,那么就加2p,在该例子中,只在右下补0了,加P就可以了。

四、池化层

对特征矩阵进行系数处理,减少数据运算量。

(一)MaxPooling下采样层

(二)AveragePooling下采样层

五、误差

(一)误差的计算



(二)误差的反向传播

以W11为例:


(三)权重的更新

1、损失梯度及参数更新


2、优化器optimazer

目的:使网络得到更快地收敛




相关推荐
网易云信1 分钟前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队12 分钟前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能
机器之心20 分钟前
飞书让表格变成「AI同事」加入群聊,不打开表就能用表
人工智能·openai
Bigfish_coding1 小时前
前端转agent-【python】-15 AI Agent 可观测性入门:LangFuse 链路追踪、Token 监控与 LLM 质量评估
人工智能
我唔知啊1 小时前
我把 Claude Code 拆成了一间餐厅:从一句话到一次回复,中间到底发生了什么
人工智能
Harry技术1 小时前
02 · Codex 核心概念:代理、沙箱、审批和项目说明书
人工智能
阿里云大数据AI技术2 小时前
Agentic Memory Extension 支持对接主流Agent - 适用于 Claude Code、CodeX等
人工智能·agent
我唔知啊2 小时前
不是让 AI 写代码,我是在指挥 AI 干活:一套打磨出来的 AI 编程工作流
人工智能
ZzT2 小时前
在 GitHub 上 @一下 claude,它自己把 issue 改成 PR
人工智能·开源
不加辣椒2 小时前
第15章 上下文窗口管理与长文本策略
人工智能