Convolutional Neural Networks

vector derivatives

Backprop with Vector

Jocobian用于输出输入均为向量的时候求导

注意方向问题

例子

如果只改变一个元素x影响y的什么

  • 改变 x1,2x_{1,2}x1,2

  • 只影响 y1,1,y1,2,y1,3,y1,4y_{1,1},y_{1,2},y_{1,3},y_{1,4}y1,1,y1,2,y1,3,y1,4

  • 所以只用 dL/dydL/dydL/dy 第一行回传

影响多少



Convolutional Neural Networks

Fully Connected Layer

Convolution Layer

Filter(卷积核)= 一小块可学习的权重参数

它是一个张量:

filter∈Rk×k×C\text{filter} \in \mathbb{R}^{k \times k \times C}filter∈Rk×k×C

  • k×k:空间大小(比如 3×3、5×5)

  • C:输入通道数

  • 里面全是可训练参数(weight)

Fully Connected Convolution
每个神经元看全图 每个神经元只看局部
参数巨大 参数很少
无空间结构 保留空间结构
无权重共享 权重共享

可视化

convolution(卷积)

  • 32 个 5×5 卷积核,一个卷积核是5* 5* 3

  • 每个卷积核都会在整张图上滑动(并行的)

  • 每个卷积核输出 一张特征图

  • 所以得到 32 张 activation maps

卷积的计算过程

步长为3

zero padding(零填充)

保持输出尺寸不变

padding = (F − 1) / 2 可以保持尺寸

计算维度

D:10个核 推出输出是10通道

参数数目

每个 filter 一个 bias

1* 1 filter

×1 卷积不会看空间,只在每个像素位置做通道线性组合,从而改变通道数并提升表达能力

Pooling layer

Pooling 对每张特征图独立做下采样,减小空间尺寸、降低计算量,并增强平移不变性

FC layer

相关推荐
独隅1 分钟前
Android Studio 接入多种不同 AI 大模型进行开发的全面详细指南(Android Studio+AI)
android·人工智能·android studio
暴躁小师兄数据学院3 分钟前
【AI大数据工程师特训笔记】第02讲:PostgreSQL数据库生态全景
大数据·数据库·人工智能·postgresql
暴躁小师兄数据学院5 分钟前
【AI大模型应用开发工程师特训笔记】第04讲(第9章):文件目录操作
人工智能·笔记·python
天天讯通5 分钟前
机器人外呼行业适用性分析
人工智能·机器人
wechat_Neal6 分钟前
Google AAOS 2026发布深度解析与对中国车企出海的战略启示
人工智能·microsoft·华为·汽车
Cosolar8 分钟前
QwenPaw 源码学习指南
人工智能·架构·github
ST——Jess15 分钟前
年度行业趋势研究报告:泛心理数字化赛道“流日推演”的算法困境与高保真交互范式重构
人工智能·算法·架构
bupt_0122 分钟前
claudecode深入理解及源码解析(一):从 main.tsx 入口到对话闭环
人工智能·语言模型
2601_9578822422 分钟前
企业矩阵系统建设实践:优化内容资产与数字获客流程
大数据·人工智能·矩阵系统·企业数字化运营
GIS数据转换器23 分钟前
智慧能源管理平台
java·大数据·运维·人工智能·无人机