Convolutional Neural Networks

vector derivatives

Backprop with Vector

Jocobian用于输出输入均为向量的时候求导

注意方向问题

例子

如果只改变一个元素x影响y的什么

  • 改变 x1,2x_{1,2}x1,2

  • 只影响 y1,1,y1,2,y1,3,y1,4y_{1,1},y_{1,2},y_{1,3},y_{1,4}y1,1,y1,2,y1,3,y1,4

  • 所以只用 dL/dydL/dydL/dy 第一行回传

影响多少



Convolutional Neural Networks

Fully Connected Layer

Convolution Layer

Filter(卷积核)= 一小块可学习的权重参数

它是一个张量:

filter∈Rk×k×C\text{filter} \in \mathbb{R}^{k \times k \times C}filter∈Rk×k×C

  • k×k:空间大小(比如 3×3、5×5)

  • C:输入通道数

  • 里面全是可训练参数(weight)

Fully Connected Convolution
每个神经元看全图 每个神经元只看局部
参数巨大 参数很少
无空间结构 保留空间结构
无权重共享 权重共享

可视化

convolution(卷积)

  • 32 个 5×5 卷积核,一个卷积核是5* 5* 3

  • 每个卷积核都会在整张图上滑动(并行的)

  • 每个卷积核输出 一张特征图

  • 所以得到 32 张 activation maps

卷积的计算过程

步长为3

zero padding(零填充)

保持输出尺寸不变

padding = (F − 1) / 2 可以保持尺寸

计算维度

D:10个核 推出输出是10通道

参数数目

每个 filter 一个 bias

1* 1 filter

×1 卷积不会看空间,只在每个像素位置做通道线性组合,从而改变通道数并提升表达能力

Pooling layer

Pooling 对每张特征图独立做下采样,减小空间尺寸、降低计算量,并增强平移不变性

FC layer

相关推荐
cici158741 天前
卡尔曼滤波器实现RBF神经网络训练
人工智能·深度学习·神经网络
Neolnfra1 天前
拒绝数据“裸奔”!把顶级AI装进自己的硬盘,这款神仙开源工具我粉了
人工智能·开源·蓝耘maas
code_li1 天前
只花了几分钟,用AI开发了一个微信小程序!(附教程)
人工智能·微信小程序·小程序
飞Link1 天前
瑞萨联姻 Irida Labs:嵌入式开发者如何玩转“端侧视觉 AI”新范式?
人工智能
RSTJ_16251 天前
PYTHON+AI LLM DAY THREETY-SEVEN
开发语言·人工智能·python
郝学胜-神的一滴1 天前
深度学习优化核心:梯度下降与网络训练全解析
数据结构·人工智能·python·深度学习·算法·机器学习
Aision_1 天前
Agent 为什么需要 Checkpoint?
人工智能·python·gpt·langchain·prompt·aigc·agi
小贺儿开发1 天前
《唐朝诡事录之长安》——盛世马球
人工智能·unity·ai·shader·绘画·影视·互动
秋91 天前
ESP32 与 Air780E 4G 模块配合做 MQTT 数据传输
人工智能
DeepFlow 零侵扰全栈可观测1 天前
运动战:AI 时代 IT 运维的决胜之道——DeepFlow 业务全链路可观测性的落地实践
运维·网络·人工智能·arcgis·云计算