Convolutional Neural Networks

vector derivatives

Backprop with Vector

Jocobian用于输出输入均为向量的时候求导

注意方向问题

例子

如果只改变一个元素x影响y的什么

  • 改变 x1,2x_{1,2}x1,2

  • 只影响 y1,1,y1,2,y1,3,y1,4y_{1,1},y_{1,2},y_{1,3},y_{1,4}y1,1,y1,2,y1,3,y1,4

  • 所以只用 dL/dydL/dydL/dy 第一行回传

影响多少



Convolutional Neural Networks

Fully Connected Layer

Convolution Layer

Filter(卷积核)= 一小块可学习的权重参数

它是一个张量:

filter∈Rk×k×C\text{filter} \in \mathbb{R}^{k \times k \times C}filter∈Rk×k×C

  • k×k:空间大小(比如 3×3、5×5)

  • C:输入通道数

  • 里面全是可训练参数(weight)

Fully Connected Convolution
每个神经元看全图 每个神经元只看局部
参数巨大 参数很少
无空间结构 保留空间结构
无权重共享 权重共享

可视化

convolution(卷积)

  • 32 个 5×5 卷积核,一个卷积核是5* 5* 3

  • 每个卷积核都会在整张图上滑动(并行的)

  • 每个卷积核输出 一张特征图

  • 所以得到 32 张 activation maps

卷积的计算过程

步长为3

zero padding(零填充)

保持输出尺寸不变

padding = (F − 1) / 2 可以保持尺寸

计算维度

D:10个核 推出输出是10通道

参数数目

每个 filter 一个 bias

1* 1 filter

×1 卷积不会看空间,只在每个像素位置做通道线性组合,从而改变通道数并提升表达能力

Pooling layer

Pooling 对每张特征图独立做下采样,减小空间尺寸、降低计算量,并增强平移不变性

FC layer

相关推荐
电子科技圈10 小时前
SmartDV展示完整的边缘与连接IP解决方案,以高速和低功耗特性赋能移动、物联网和媒体处理设备创新
人工智能·嵌入式硬件·mcu·物联网·智能家居·智能硬件·iot
Rubin智造社10 小时前
04月17日AI每日参考:Claude Opus 4.7正式发布,智元机器人大会今日开幕
大数据·人工智能·机器学习·claude code·智元机器人·deepseek v4·claude opus 4.7
Raink老师17 小时前
【AI面试临阵磨枪】详细解释 Transformer 架构的核心组件与工作流程。
人工智能·深度学习·transformer·ai 面试·ai 应用开发
qcx2317 小时前
【AI Agent实战】OpenClaw 安全加固完全指南:安全攻击手段与五步防护实践(2026最新)
人工智能·安全
AnnyYoung18 小时前
单细胞转录组+空间转录组+深度学习的意义
深度学习·数据分析
码农小白AI18 小时前
AI报告审核进入技术驱动时代:IACheck如何从规则引擎走向深度学习,构建检测报告审核“技术矩阵”
人工智能·深度学习
song1502653729818 小时前
视觉检测设备:自动识别缺陷、尺寸、瑕疵、装配错误,一键全检
人工智能·计算机视觉·视觉检测
智能化咨询18 小时前
(163页PPT)某著名企业K3生产制造售前营销指导方案P164(附下载方式)
大数据·人工智能
Zzj_tju18 小时前
大语言模型技术指南:SFT、RLHF、DPO 怎么串起来?对齐训练与关键参数详解
人工智能·深度学习·语言模型
金智维科技官方18 小时前
RPA技术赋能电信运营商话单稽核:金智维如何驱动高精度自动化转型
人工智能·自动化·数字化·rpa·智能体·电信