Convolutional Neural Networks

vector derivatives

Backprop with Vector

Jocobian用于输出输入均为向量的时候求导

注意方向问题

例子

如果只改变一个元素x影响y的什么

  • 改变 x1,2x_{1,2}x1,2

  • 只影响 y1,1,y1,2,y1,3,y1,4y_{1,1},y_{1,2},y_{1,3},y_{1,4}y1,1,y1,2,y1,3,y1,4

  • 所以只用 dL/dydL/dydL/dy 第一行回传

影响多少



Convolutional Neural Networks

Fully Connected Layer

Convolution Layer

Filter(卷积核)= 一小块可学习的权重参数

它是一个张量:

filter∈Rk×k×C\text{filter} \in \mathbb{R}^{k \times k \times C}filter∈Rk×k×C

  • k×k:空间大小(比如 3×3、5×5)

  • C:输入通道数

  • 里面全是可训练参数(weight)

Fully Connected Convolution
每个神经元看全图 每个神经元只看局部
参数巨大 参数很少
无空间结构 保留空间结构
无权重共享 权重共享

可视化

convolution(卷积)

  • 32 个 5×5 卷积核,一个卷积核是5* 5* 3

  • 每个卷积核都会在整张图上滑动(并行的)

  • 每个卷积核输出 一张特征图

  • 所以得到 32 张 activation maps

卷积的计算过程

步长为3

zero padding(零填充)

保持输出尺寸不变

padding = (F − 1) / 2 可以保持尺寸

计算维度

D:10个核 推出输出是10通道

参数数目

每个 filter 一个 bias

1* 1 filter

×1 卷积不会看空间,只在每个像素位置做通道线性组合,从而改变通道数并提升表达能力

Pooling layer

Pooling 对每张特征图独立做下采样,减小空间尺寸、降低计算量,并增强平移不变性

FC layer

相关推荐
Zero几秒前
机器学习概率论与统计学--(5)概率论:离散分布
机器学习·概率论·统计学·离散分布
张驰咨询公司3 分钟前
电池制造进入“统计控制时代”:六西格玛如何解锁材料一致性的终极密码
人工智能·六西格玛培训·六西格玛绿带培训·精益六西格·六西格玛培训公司
FluxMelodySun7 分钟前
机器学习(二十六) 降维:流形学习
人工智能·机器学习
智算菩萨12 分钟前
OpenCV色彩空间转换实战:BGR转HSV/LAB的工业应用场景详解(含自动化脚本)
人工智能·python·opencv·计算机视觉·自动化·音视频
码农三叔19 分钟前
(11-3)感知-运动耦合与行为理解:行为识别与预测
人工智能·机器人·自动驾驶·agent·人形机器人
南啸天20 分钟前
Context Window:上下文窗口”“token 上限
人工智能·ai·状态模式
XMAIPC_Robot26 分钟前
基于RK3588 ARM+FPGA的电火花数控硬件平台总体设计(二)
运维·arm开发·人工智能·fpga开发·边缘计算
天行健,君子而铎29 分钟前
从人工规则到智能认知:构建自适应、高性能与合规并重的数据分类分级体系
大数据·人工智能·分类
Are_You_Okkk_30 分钟前
研发运维一体化:开源知识库落地案例与价值探析
运维·人工智能·架构·开源
俊哥V38 分钟前
每日 AI 研究简报 · 2026-03-25
人工智能·ai