CNN(卷积神经网络)的实现过程详解


概要

在图像处理领域,CNN(卷积神经网络)处于绝对统治地位,但对于CNN具体是如何用神经网络实现的,能找到的介绍要么是一大堆数学公式,要么是大段晦涩的文字说明,读起来很是辛苦,想写好一片完整的而且有深度的文章出来非常难,所以本文适合入门的朋友对CNN的学习和了解。

CNN主要思路快速回顾

为了便于大家理解,这里简单回顾一下CNN的主要思路:对于一张M * N像素的图,我们用一个大小为 S * S(如3 * 3)的特征提取器,扫描整个图片,强化图片的重要特征,忽略不重要的细节,得到一个强化了特征的新图:

不断递归上述过程,就可以逐渐从细节特征(如线条、纹理)中提取出高级特征(如器官、物种),最终完成各种图像处理任务。

图解CNN的神经网络实现过程

假设我们有一张3 * 3的图,图中每个像素用一个字母表示:

我们的特征提取器为一个2 * 2的矩阵,矩阵每个元素是一个希腊字母:

用特征提取器处理后的图片为:

其详细工作过程如下:

上述工作过程可以表达为以下等式:

注意上述等式中的bias参数b在4个等式中都是一样的,可以把b理解为特征提取器的一部分,就像权重参数(α, β, γ, δ)是特征提取器的一部分一样。

上述等式更紧凑的写法为:

上述写法可以直接表示为一个神经网络(连接线对应权重α, β, γ, δ):

神经元的激活过程就是权重矩阵和输入矩阵的乘积:

这里有两个要注意的点:

  • 灰色格子的0,代表不可训练的参数,它们在整个训练过程中始终为0

  • 剩下可训练的参数中,很多参数取值是保持相同的,这叫做"共享权重"

权重矩阵的每一行,代表了在图片上对特征过滤器的一次应用,其中的0表示这次应用不会覆盖的像素。

假设我们把取值为0的权重也补充到上面的神经网络图中(用灰色的线表示0权重),就可以得到一个经典的、全连接的神经网络图:

去掉颜色和字母,就和熟悉的神经网络示意图一模一样了:

上面,我们用一个2 * 2的特征提取器把一个3 * 3的图变成了一个2 * 2的图,通过zero-padding和一个3 * 3的特征提取器,我们就可以保持图片大小不变:

其工作过程如下:

而如果不应用zero-padding,则我们只能得到一个1 * 1的结果图:

以上就是CNN落地实现为神经网络的过程,欢迎大家阅读,感谢🙏。

相关推荐
ACP广源盛139246256732 分钟前
GSV2231 三屏显示扩展芯片@ACP#RTX Spark AI 终端多屏协作专属解决方案
大数据·人工智能·分布式·信息可视化·spark·电脑·音视频
碳基硅坊4 分钟前
在Mac上跑26B大模型:M4 Max + MLX量化推理实测
人工智能·模型部署·gemma-4-26b-a4b
无忧智库9 分钟前
破局“数据孤岛”与“面子工程”:万字深度解构新型智慧城市“云数智”融合的底层逻辑与实战路径(PPT)
大数据·人工智能·智慧城市
aneasystone本尊11 分钟前
让小龙虾给 Claude Code 派活:学习 OpenClaw 的 ACP 工具
人工智能
带娃的IT创业者13 分钟前
AI Slop 正在吞噬互联网:当生成式泛滥成为技术社区的隐形杀手
人工智能·大模型·生成式ai·内容质量·ai slop·技术社区
qingyulee14 分钟前
深度学习——神经网络基础
人工智能·深度学习·神经网络
程序员佳佳16 分钟前
向量引擎:AI 时代的“记忆中枢“,从原理到落地的完整认知框架
人工智能·gpt·架构·aigc·ai编程
财经资讯数据_灵砚智能16 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月7日
人工智能·python·ai·信息可视化·自然语言处理·ai编程·灵砚智能
探客木木夕16 分钟前
分布式全球类脑智能网络架构设计
网络·人工智能·分布式·边缘计算
郭老二17 分钟前
【经验】CSDN-AI数字营销试用测评3
人工智能