CNN 多层设计详解:从边缘到高级特征的逐层学习

一、概念

卷积神经网络(CNN) 中,模型通常不是一两层,而是由 多层卷积层、池化层、全连接层 堆叠起来。

原因在于:每一层都在学习不同层次的特征,从 简单 → 复杂,逐步组合。


二、原理

1. 层的分工

  • 卷积层(Conv2D)

    • 提取局部特征。
    • 第一层学边缘、线条;第二层学纹理、角点;更深层学物体部件。
  • 激活函数层(ReLU, LeakyReLU 等)

    • 引入非线性,否则网络只能学"线性变换"。
  • 池化层(MaxPooling/AveragePooling)

    • 下采样,减少参数,保留关键信息,增强平移不变性。
  • 全连接层(Dense)

    • 把卷积提取的特征组合起来,完成分类/回归。
  • Softmax 层

    • 把数值转成概率,用于分类输出。

2. 分层特征表示

可以类比人类视觉:

  • 低层神经元只对"边缘/亮度"敏感;
  • 中层神经元能识别"形状/图案";
  • 高层神经元能识别"物体整体"(比如数字 5、猫耳朵)。

三、对比

网络层 学习内容 作用 类比人类视觉
卷积层1 边缘、直线、颜色斑块 初步特征提取 看到"黑白对比"
卷积层2 纹理、角点 组合低层特征 看到"弯曲的线"
卷积层3+ 复杂形状、局部物体 更高语义特征 看到"眼睛/鼻子/数字形状"
池化层 缩小空间维度 提升鲁棒性 只在意"有无",不在意具体位置
全连接层 全局组合 输出分类/预测结果 大脑做"最终判断"

四、实践(代码示例:多层 CNN)

less 复制代码
const model = tf.sequential();

// 第1层卷积:学边缘
model.add(tf.layers.conv2d({
  inputShape: [28, 28, 1],
  filters: 32,
  kernelSize: 3,
  activation: 'relu'
}));
model.add(tf.layers.maxPooling2d({poolSize: [2, 2]}));

// 第2层卷积:学纹理
model.add(tf.layers.conv2d({
  filters: 64,
  kernelSize: 3,
  activation: 'relu'
}));
model.add(tf.layers.maxPooling2d({poolSize: [2, 2]}));

// 第3层卷积:学更复杂的形状
model.add(tf.layers.conv2d({
  filters: 128,
  kernelSize: 3,
  activation: 'relu'
}));
model.add(tf.layers.flatten());

// 全连接层:组合特征
model.add(tf.layers.dense({units: 128, activation: 'relu'}));

// 输出层:分类 0-9
model.add(tf.layers.dense({units: 10, activation: 'softmax'}));

👉 注释:

  • Conv2D×3:逐层提取特征。
  • MaxPooling2D:缩小特征图,减少计算。
  • Flatten + Dense:把空间特征变成全局判断。
相关推荐
漂流瓶jz16 小时前
Webpack如何实现万物皆可import?loader的使用/配置/手写实践
前端·javascript·webpack
ZC跨境爬虫16 小时前
跟着 MDN 学CSS day_41:显式轨道、隐式网格与区域命名放置
前端·javascript·css·ui·交互
修己xj17 小时前
告别手动存图!这款叫 Fatkun 的浏览器插件,简直是素材收集神器
前端
袋鼠云数栈18 小时前
从前端到基础设施,ACOS 如何打通企业全链路可观测
运维·前端·人工智能·数据治理·数据智能
AskHarries18 小时前
系统提示词、开发者指令和用户输入的优先级
java·前端·数据库
Moment18 小时前
长上下文会最终杀死 Rag 吗?
前端·javascript·后端
qcx2318 小时前
【系统学AI】25 论文导读 ①:两篇改变 AI 的开山之作——Attention Is All You Need & ReAct
前端·人工智能·react.js·transformer
kyriewen19 小时前
大文件上传最全指南:分片、断点续传、秒传,一篇就够了
前端·javascript·面试
郑洁文20 小时前
基于Python的Web命令执行漏洞自动化检测系统
前端·python·网络安全·自动化
新酱爱学习20 小时前
手搓 10 个 Skill 后,我把重复劳动收敛成了一套零依赖 CLI 工具
前端·javascript·人工智能