卷积神经网络(CNN)

一、什么是卷积神经网络

二、结构

卷积神经网络的基本结构由以下几个部分组成:输入层(input layer),卷积层(convolution layer),池化层(pooling layer),激活函数层和全连接层(full-connection layer)。下面以图像分类任务简单介绍一下卷积神经网络结构,具体结构如下图所示。

输入层

在处理图像的CNN中,输入层一般代表了一张图片的像素矩阵。可以用三维矩阵代表一张图片。三维矩阵的长和宽代表了图像的大小,而三维矩阵的深度代表了图像的色彩通道。比如黑白图片的深度为1,而在RGB色彩模式下,图像的深度为3。

卷积层

卷积神经网络的核心是卷积层,卷积层的核心部分是卷积操作。对图像和滤波矩阵做内积(逐个元素相乘再求和)的操作就是所谓的卷积操作,也是卷积神经网络的名字来源。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。

池化

池化层的作用是去除冗余信息、对特征进行压缩、简化网络复杂度、减小计算量。 池化操作将输入矩阵某一位置相邻区域的总体统计特征作为该位置的输出,主要有平均池化 (Average Pooling)、最大池化 (Max Pooling)等。简单来说池化就是在该区域上指定一个值来代表整个区域。池化层的超参数:池化窗口和池化步长。池化操作也可以看做是一种卷积操作

比如下图,选择最大池化

激活函数层

激活函数(非线性激活函数,如果激活函数使用线性函数的话,那么它的输出还是一个线性函数。)但使用非线性激活函数可以得到非线性的输出值。常见的激活函数有Sigmoid、tanh和Relu等。一般我们使用Relu作为卷积神经网络的激活函数。

全连接层

在经过多轮卷积层和池化层的处理之后,在CNN的最后一般会由1到2个全连接层来给出最后的分类结果。经过几轮卷积层和池化层的处理之后,可以认为图像中的信息已经被抽象成了信息含量更高的特征。我们可以将卷积层和池化层看成自动图像特征提取的过程。在提取完成之后,仍然需要使用全连接层来完成分类任务

Softmax层

通过Softmax层,可以得到当前样例属于不同种类的概率分布问题。

参考:

卷积神经网络(CNN)详细介绍及其原理详解-CSDN博客

卷积神经网络超详细介绍-CSDN博客

一文精简介绍CNN神经网络_cnn的网络结构-CSDN博客

相关推荐
文慧的科技江湖10 分钟前
图文结合 - 光伏系统产品设计PRD文档 -(慧哥)慧知开源充电桩平台
人工智能·开源·储能·训练·光伏·推理
白熊18814 分钟前
【计算机视觉】CV实战项目 - 基于YOLOv5与DeepSORT的智能交通监控系统:原理、实战与优化
人工智能·yolo·计算机视觉
gis收藏家26 分钟前
几何编码:启用矢量模式地理空间机器学习
人工智能·机器学习
不吃酸的柠檬31 分钟前
MATLAB 中的图形绘制
人工智能·机器学习·matlab
Ai工具分享1 小时前
6 种AI实用的方法,快速修复模糊照片
人工智能
dundunmm1 小时前
【每天一个知识点】如何解决大模型幻觉(hallucination)问题?
人工智能·数据挖掘·大模型
勤奋的小懒猪1 小时前
Halcon应用:相机标定之应用
图像处理·人工智能·计算机视觉
白熊1881 小时前
【计算机视觉】CV实战项目- 深度解析FaceAI:一款全能的人脸检测与图像处理工具库
图像处理·人工智能·计算机视觉
量子位1 小时前
实测免费 DeepResearch!轻量版深夜上线,基于 o4-mini,速度更快 / 重视脉络梳理
人工智能·openai
nenchoumi31191 小时前
VLA 论文精读(十八)π0.5: a Vision-Language-Action Model with Open-World Generalization
论文阅读·人工智能·深度学习·语言模型·vla