CNN学习

卷积层(特征提取器)

利用一个滑动窗口(卷积核)在图片上移动,计算窗口内像素与卷积核权重的乘积之和,用以捕捉局部特征(如边缘、纹理)。

卷积后生成的新图片(特征图)在坐标处的值。你可以理解为:这是侦探扫描完这一小块区域后得出的"结论得分"。

这是两个求和符号。意思是我们要把这个小窗口里所有算出来的结果都加起来

这是原始图片 里的像素值。表示当前扫描窗口覆盖的那一小块区域。

这是卷积核(也叫滤镜/权重)。它是模型学习到的核心。比如,如果它是一个"横线滤镜",那么它的数值排列就像一条横线。

这是一个常数,就像调色时的"底色"。即使前面算出来是 0,加上偏置也可以微调最后的结果。

尺寸计算公式

:输入高度

:填充(在图片外围补 0 的圈数)

:卷积核尺寸

:步长(每次滑动几个像素)

:向下取整

输入的图,卷积核,步长1,填充0:

结果为

激活函数------非线性引入

如果没有激活函数,多层神经网络退化为线性回归。ReLU负责舍弃负信号,保留正信号。

池化层------降维与压缩

通过取局部区域的最大值或平均值,减少数据量,提高模型的容错性。

全连接层------最终分类

将前面提取的所有特征图"打碎"成一维向量,最后通过加权求和得出每个类别的得分。

:输入特征向量

:权重矩阵

完整流程

相关推荐
yiyu071613 小时前
3分钟搞懂深度学习AI:梯度下降:迷雾中的下山路
人工智能·深度学习
CoovallyAIHub15 小时前
Moonshine:比 Whisper 快 100 倍的端侧语音识别神器,Star 6.6K!
深度学习·算法·计算机视觉
vivo互联网技术15 小时前
ICLR2026 | 视频虚化新突破!Any-to-Bokeh 一键生成电影感连贯效果
人工智能·python·深度学习
OpenBayes贝式计算16 小时前
边看、边听、边说,MiniCPM-0-4.5 全双工全模态模型;Pan-Cancer scRNA-Seq 涵盖三种生物学状态单细胞转录数据集
人工智能·深度学习·机器学习
CoovallyAIHub16 小时前
速度暴涨10倍、成本暴降6倍!Mercury 2用扩散取代自回归,重新定义LLM推理速度
深度学习·算法·计算机视觉
OpenBayes贝式计算16 小时前
教程上新丨基于500万小时语音数据,Qwen3-TTS实现3秒语音克隆及精细调控
人工智能·深度学习·机器学习
CoovallyAIHub19 小时前
OpenClaw一脚踩碎传统CV?机器终于不再只是看世界
深度学习·算法·计算机视觉
CoovallyAIHub19 小时前
仅凭单目相机实现3D锥桶定位?UNet-RKNet破解自动驾驶锥桶检测难题
深度学习·算法·计算机视觉
Narrastory3 天前
明日香 - Pytorch 快速入门保姆级教程(一)
人工智能·pytorch·深度学习