初识CNN

一、卷积网络与传统网络的区别

1. 传统的是二维的,特征很多,卷积是三维的,将图片直接输入

二、整体架构

输入层->卷积层->池化层->全连接层

三、卷积做了什么事

1、

将图片分成一块一块,如上图所示,原图片是55 3,5是长,5是宽,3是深度(之所以是3是因为RGB,三个通道),分类以33为一块,3个通道的矩阵分别与flter内积得到三个值,再相加,得到一个值后,再加上一个bias,然后输出,结果见上图,不同的通道filter不同,即一个filter是一个卷积内核,33(前面两个三自己定)*3(必须与输入数据的深度相同),旁边灰色的0是用来填充的,这样原本是边界的值不再是边界,增加使用的概论。

2、特征图的个数

如上图所示,我们得到了两个28*28的两个特征图,说明有两个filter

3.堆叠的卷积层

如上图所示,多层卷积的意思是在提取出的特征图上再使用卷积。第一次卷积用55 3,之所以是3 ,是因为前面的深度是3,用了6个卷积核,得到2828 6的特征;第二次卷积用了55 6的卷积核,之所以是6是因为前面的深度是6,用了10个卷积核,得到242410的特征。

4.卷积层涉及的参数

滑动窗口步长越小,卷积核尺寸越小,粒度越细,反之越粗。边缘填充上面已经说明,即填充0,卷积核个数代表特征图个数

5、卷积计算结果公式

题目:假设数据是3232 3的图像,用10个553的卷积核,请问有多少个权重参数?

答:553*10=750,750+10=760()需要加上偏置值

注意,卷积参数共享

四、池化层

如图所示的是最大池化层,它起到一个缩小长和宽的作用,进行筛选过滤,但不能改变特征数,最常用的是最大池化,即选择权重最高的。其过程没有涉及矩阵的运算

五、举例说明

如图所示,CONV即卷积,RELU是激活函数,POOL是池化层,最后,假设我们得到了3232 10的特征图,最后再将其拉成102400*1的向量,再使用【10240,5】的全连接层,进行分类。其中,只有进行矩阵运算的才算一层,在该图中有6次卷积,1次全连接涉及矩阵运算,故有6+1=7层

相关推荐
风象南5 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶6 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶6 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考8 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab9 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab9 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸11 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云11 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny86511 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔11 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能