初识CNN

一、卷积网络与传统网络的区别

1. 传统的是二维的,特征很多,卷积是三维的,将图片直接输入

二、整体架构

输入层->卷积层->池化层->全连接层

三、卷积做了什么事

1、

将图片分成一块一块,如上图所示,原图片是55 3,5是长,5是宽,3是深度(之所以是3是因为RGB,三个通道),分类以33为一块,3个通道的矩阵分别与flter内积得到三个值,再相加,得到一个值后,再加上一个bias,然后输出,结果见上图,不同的通道filter不同,即一个filter是一个卷积内核,33(前面两个三自己定)*3(必须与输入数据的深度相同),旁边灰色的0是用来填充的,这样原本是边界的值不再是边界,增加使用的概论。

2、特征图的个数

如上图所示,我们得到了两个28*28的两个特征图,说明有两个filter

3.堆叠的卷积层

如上图所示,多层卷积的意思是在提取出的特征图上再使用卷积。第一次卷积用55 3,之所以是3 ,是因为前面的深度是3,用了6个卷积核,得到2828 6的特征;第二次卷积用了55 6的卷积核,之所以是6是因为前面的深度是6,用了10个卷积核,得到242410的特征。

4.卷积层涉及的参数

滑动窗口步长越小,卷积核尺寸越小,粒度越细,反之越粗。边缘填充上面已经说明,即填充0,卷积核个数代表特征图个数

5、卷积计算结果公式

题目:假设数据是3232 3的图像,用10个553的卷积核,请问有多少个权重参数?

答:553*10=750,750+10=760()需要加上偏置值

注意,卷积参数共享

四、池化层

如图所示的是最大池化层,它起到一个缩小长和宽的作用,进行筛选过滤,但不能改变特征数,最常用的是最大池化,即选择权重最高的。其过程没有涉及矩阵的运算

五、举例说明

如图所示,CONV即卷积,RELU是激活函数,POOL是池化层,最后,假设我们得到了3232 10的特征图,最后再将其拉成102400*1的向量,再使用【10240,5】的全连接层,进行分类。其中,只有进行矩阵运算的才算一层,在该图中有6次卷积,1次全连接涉及矩阵运算,故有6+1=7层

相关推荐
Orange--Lin6 分钟前
【用deepseek和chatgpt做算法竞赛】——还得DeepSeek来 -Minimum Cost Trees_5
人工智能·算法·chatgpt
范桂飓11 分钟前
大规模 RDMA AI 组网技术创新:算法和可编程硬件的深度融合
人工智能
deflag24 分钟前
第P10周-Pytorch实现车牌号识别
人工智能·pytorch·yolo
pzx_00129 分钟前
【机器学习】K折交叉验证(K-Fold Cross-Validation)
人工智能·深度学习·算法·机器学习
海域云赵从友41 分钟前
助力DeepSeek私有化部署服务:让企业AI落地更简单、更安全
人工智能·安全
伊一大数据&人工智能学习日志1 小时前
自然语言处理NLP 04案例——苏宁易购优质评论与差评分析
人工智能·python·机器学习·自然语言处理·数据挖掘
刀客1231 小时前
python3+TensorFlow 2.x(六)自编码器
人工智能·python·tensorflow
大模型之路1 小时前
Grok-3:人工智能领域的新突破
人工智能·llm·grok-3
闻道且行之2 小时前
LLaMA-Factory|微调大语言模型初探索(4),64G显存微调13b模型
人工智能·语言模型·llama·qlora·fsdp
喝不完一杯咖啡2 小时前
【AI时代】可视化训练模型工具LLaMA-Factory安装与使用
人工智能·llm·sft·llama·llama-factory