数据挖掘06

数据挖掘06

1.卷积神经网络

卷积神经网络(Convolutional Neural Network,简称 CNN)是一种专门用于处理具有网格结构数据的深度学习模型,

2.传统神经网络不具备不变性。

(1)什么是"不变性"?

在模式识别中,不变性指的是:当输入数据发生某种变换(如平移、旋转、缩放、光照变化等)时,模型的输出(如分类结果)保持不变。

例如:

一张猫的图片向左移动几个像素,模型仍应识别为"猫" → 平移不变性

(2)传统全连接神经网络为什么缺乏不变性?

1)全连接结构:每个输入像素(如图像中的每个像素点)都与下一层的神经元单独连接,权重独立。

2)没有空间结构感知:它把图像当作一维向量处理,完全忽略了像素之间的空间局部关系。

3)对位置敏感:如果目标物体在图像中移动了,输入向量就完全不同,网络可能无法识别。

3.卷积神经网络的组成

(1)卷积层(Convolutional Layer)

(2)池化层(Pooling Layer)

(3)激活函数(Activation Function)

(4)关键要素

(5)卷积操作

对应点乘再求和,得到一个新值。

有单通道和双通道。

先 举个单通道的例子:

输出矩阵左上角的元素 0 = 0×0+ 0×1 + 0×2 + 0×3

算法是一样的,多通道就是要对每个通道点乘求和,只不过多了一步把各个通道的结果相加。

再举个双通道的例子:

(4)卷积输出尺寸计算公式:

如果卷积核不是正方形,可分别对高和宽计算。

(备注:如果结果不是整数,通常向下取整(floor),表示无法完整滑动时丢弃边缘)

总结:

(输入 + 2×padding − 卷积核) ÷ 步长,向下取整再加1

(5)怎么理解卷积输出尺寸?

1)举个例子

2)为什么是 "−K"?

因为卷积核必须完全落在有效区域内。

比如有 5 个位置,但一个 3 单位宽的窗口只能从位置 0、1、2 开始,否则会"伸出边界"。

4.通过例题加深理解

(1)例题1单选

题目:在卷积神经网络(CNN)中,下列关于卷积操作的描述,错误的是哪一项?

A. 卷积操作可有效提取图像的局部特征

B. 卷积核的权重在网络训练过程中保持不变

C. 通过调整步长(stride)可影响输出特征图的尺寸

D. 填充(padding)操作可避免特征图尺寸过快减小

答案:B

理由:

在训练过程中,卷积核的权重是可学习参数,会通过反向传播和优化算法(如SGD、Adam)不断更新。如果权重"保持不变",模型就无法学习任何特征,完全失去意义。

(2)例题2单选

题目:在卷积神经网络(CNN)中,下列哪一项因素不会直接影响卷积层输出特征图的尺寸?

A. 卷积核大小(Kernel size)

B. 步长(Stride)

C. 激活函数的类型(Activation function)

D. 填充的大小(Padding)

答案:C

理由:

因为它不改变特征图的空间尺寸,只是对每个像素值做非线性变换。

(3)例题3多选

答案:ABCE

理由:偏差是由损失函数来衡量的,优化器是根据这个偏差进行参数调整的工具。优化器并不估计偏差,所以D错误。

(4)例题4多选

答案:ABC

理由:

单层神经网络可以表示非线性,只要使用非线性激活函数(如Sigmoid、ReLU)。

(5)例题5单选

答案:A

理由:

每个像素对应一个输入神经元 → 输入层有 10⁶ 个神经元

每个像素有 1 个隐藏层节点接收并处理 → 隐藏层有 10⁶ 个神经元

全连接结构:每个输入神经元都连接到每个隐藏层神经元

那么就有:

权重数=输入层神经元数×隐藏层神经元数

所以选A

(6)例题6多选

答案:AC

理由:

想象你有一张大信封(代表输入图像),你要在上面贴很多小邮票(代表卷积核)来"盖章认证"每一个区域。

每张贴上的邮票必须完全落在信封上(这是标准卷积,不越界);

你从左到右、从上到下移动邮票,每次移动一小步(比如1格);

信封中间的区域会被很多邮票覆盖(比如某个中心点,可能出现在几十张贴纸的中间);

但信封最边缘的一圈(比如最左边一列、最上一行)

只有当邮票刚好靠边时才能盖到,

所以只被盖1次或2次,甚至某些角落只被盖1次!

结果:边缘信息"认证不足",容易被忽略!

A. 对图像边缘进行扩充(比如用白色填充)

相当于:把信封四周加一圈白纸边(像相框一样)!

原来的边缘像素现在变成了"新信封"的内圈,有效,A对

B. 使用更大的邮票(更大的卷积核)

相当于 邮票变大了(比如从3×3变成7×7)!

问题更严重了!因为大邮票更难贴到角落;所以B错

C. 使用更小的邮票(比如1×1或3×3)

小邮票更容易贴到边缘,确实能多盖几次边缘。

所以C对

D. 每次移动邮票的步子更大(比如跳2格)

相当于 邮票跳着走!

很多地方直接跳过,边缘更可能被漏掉;D错

(7)例题7单选

答案:A

(8)例题8多选

答案:ABCD

5.池化

(1)定义

池化(Pooling)是卷积神经网络(CNN)中一种重要的下采样(downsampling)操作。

(2)目的

1)降维:减小特征图尺寸,节省计算资源。

2)防止过拟合:通过丢弃部分细节信息,提升泛化能力。

3)增强平移不变性:即使目标在图像中轻微移动,池化后的结果变化不大。

4)突出主要特征:保留最显著的响应(如最大值),抑制噪声。

(3)常见池化类型

1)最大池化(Max Pooling)

在每个局部窗口中取最大值作为输出。

2)平均池化(Average Pooling)

在窗口内取平均值。

(4)池化的参数

和卷积类似,池化也有:

1)池化窗口大小(pool size):如 2×2

2)步长(stride):通常等于窗口大小(如 stride=2 表示不重叠滑动)

3)填充(padding):较少使用,但某些框架支持

不同的是:

池化没有可学习参数!它是一个固定的、确定性的操作。

相关推荐
说私域5 小时前
开源链动2+1模式商城小程序在深度分销数字化转型中的应用研究
人工智能·小程序·开源·流量运营·私域运营
weixin_509138345 小时前
专业书评 | 《智能体认知动力学导论》:当思维有了形状
人工智能·智能体·认知动力学
nvd115 小时前
LangChain 核心对比:ChatPromptTemplate vs PromptTemplate
人工智能·langchain
万岳软件开发小城6 小时前
在线问诊系统源码实战:视频/图文问诊平台搭建步骤全解析
人工智能·开源·源码·在线问诊系统源码·问诊app开发·问诊软件开发·视频问诊小程序
DN20206 小时前
AI销售机器人的隐私痛点与破解之道
人工智能·python·机器学习·机器人·节日
VALENIAN瓦伦尼安教学设备6 小时前
镭射对心仪在联轴器找正作用
大数据·数据库·人工智能·嵌入式硬件
清铎6 小时前
项目_Agent实战
开发语言·人工智能·深度学习·算法·机器学习
沃达德软件6 小时前
视频侦查图像清晰化技术
图像处理·人工智能·目标检测·机器学习·计算机视觉·视觉检测·超分辨率重建
数说星榆1816 小时前
AI存储革新:专为大模型设计的高性能存储
人工智能
Σίσυφος19006 小时前
特征值分解eig
人工智能·算法