【深度学习】CNN卷积神经网络基础

一、发展历程

只要包含了卷积层的网络都可以理解为卷积神经网络。

二、全连接层

神经元按列进行排列,并列与列的神经元进行全连接 ,就可以的得到BP神经网络。

eg:利用BP神经网络做车牌数字识别

将5*5的矩阵按行展开,并拼接成一个行向量,此时就可以将该行向量作为输入层

输出层期望:

训练:

三、卷积层

(一)卷积

卷积:滑动窗口在特征图进行滑动并计算。

目的:进行特征提取

卷积特性:拥有局部感知机制(以滑动窗口的形式进行计算),权值共享(滑动过程中窗口的值不会发生改变)。

普通神经网络:体量过大

多维(通道)特征向量做卷积操作,深度(通道channel)保持一致,如正常特征图RGB三个维度,那么卷积核理应保持三个维度。将每个维度的卷积核放到对应的维度上做卷积操作,最后求和。

  • 卷积核的channel与输入特征层的channel相同
  • 输出的特征矩阵channel与卷积核个数相同
  • bias偏移量:输出的特征矩阵直接和偏移量相加
  • 加上激活函数如何计算?

(二)激活函数

在计算过程中是一个线性的计算过程,为了使其具备非线性的计算能力。

(三)卷积计算越界处理

一般情况下在上下左右都补0,那么就加2p,在该例子中,只在右下补0了,加P就可以了。

四、池化层

对特征矩阵进行系数处理,减少数据运算量。

(一)MaxPooling下采样层

(二)AveragePooling下采样层

五、误差

(一)误差的计算



(二)误差的反向传播

以W11为例:


(三)权重的更新

1、损失梯度及参数更新


2、优化器optimazer

目的:使网络得到更快地收敛




相关推荐
墨染天姬2 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志2 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114242 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠2 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光3 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好3 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力3 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo3 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_3 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能
枫叶林FYL3 小时前
【自然语言处理 NLP】7.2.2 安全性评估与Constitutional AI
人工智能·自然语言处理