CNN 分层详解:卷积、池化到全连接的作用与原理


一、第一层卷积 + 池化

less 复制代码
// 第1层卷积:学边缘
model.add(tf.layers.conv2d({
  inputShape: [28, 28, 1], // 输入是28×28的灰度图
  filters: 32,             // 提取32种特征
  kernelSize: 3,           // 卷积核大小3×3
  activation: 'relu'       // 激活函数:非线性
}));
model.add(tf.layers.maxPooling2d({poolSize: [2, 2]}));

作用

  • 卷积核(3×3)会扫描图片,学习到"局部边缘特征"(比如横线、竖线、斜线)。
  • 32 个 filters 就相当于 32 双不同的"眼睛",每个眼睛关注不同方向的边缘。
  • relu 保证输出非线性,否则网络只能学直线关系。
  • MaxPooling(2×2) 把特征图缩小一半,减少计算,同时保留"最显著"的特征(增强平移不变性)。

二、第二层卷积 + 池化

less 复制代码
// 第2层卷积:学纹理
model.add(tf.layers.conv2d({
  filters: 64,
  kernelSize: 3,
  activation: 'relu'
}));
model.add(tf.layers.maxPooling2d({poolSize: [2, 2]}));

作用

  • 在第一层学到"边缘"的基础上,这一层能把边缘组合成"纹理、角点、曲线"。
  • 64 filters = 64 种更复杂的特征检测器。
  • 再次 MaxPooling → 缩小尺寸,避免特征图过大。

三、第三层卷积

less 复制代码
// 第3层卷积:学更复杂的形状
model.add(tf.layers.conv2d({
  filters: 128,
  kernelSize: 3,
  activation: 'relu'
}));
model.add(tf.layers.flatten());

作用

  • 继续在"纹理"基础上,学习更高级的形状,比如:圈、数字结构、局部物体。
  • 128 filters = 学习更多样的复杂特征。
  • Flatten:把二维的特征图摊平成一维向量,方便后面的全连接层做分类。

四、全连接层

less 复制代码
// 全连接层:组合特征
model.add(tf.layers.dense({units: 128, activation: 'relu'}));

作用

  • Dense 层相当于"大脑整合":把所有局部特征(边缘、纹理、形状)组合在一起。
  • units: 128 表示有 128 个神经元,每个神经元会学习一种组合方式。
  • relu 继续保持非线性,增强表达能力。

五、输出层

less 复制代码
// 输出层:分类 0-9
model.add(tf.layers.dense({units: 10, activation: 'softmax'}));

作用

  • 最终分类层,把上一步的综合特征转化为"属于每个类别的概率"。

  • units: 10 = 10 个类别(数字 0--9)。

  • softmax 会把输出变成概率分布,比如:

    csharp 复制代码
    [0.01, 0.02, 0.05, 0.80, 0.02, 0.05, 0.01, 0.02, 0.01, 0.01]

    → 表示模型认为这张图是"3"的概率最高(80%)。

相关推荐
excel5 小时前
CNN 多层设计详解:从边缘到高级特征的逐层学习
前端
西陵6 小时前
Nx带来极致的前端开发体验——任务编排
前端·javascript·架构
大前端helloworld6 小时前
从初中级如何迈入中高级-其实技术只是“入门卷”
前端·面试
东风西巷8 小时前
Balabolka:免费高效的文字转语音软件
前端·人工智能·学习·语音识别·软件需求
萌萌哒草头将军8 小时前
10个 ES2025 新特性速览!🚀🚀🚀
前端·javascript·vue.js
半夏陌离8 小时前
SQL 入门指南:排序与分页查询(ORDER BY 多字段排序、LIMIT 分页实战)
java·前端·数据库
whysqwhw8 小时前
鸿蒙工程版本与设备版本不匹配
前端
gnip8 小时前
http缓存
前端·javascript