从卷积到全连接：用示例理解 CNN 的分层

一、第一层卷积：学边缘

假设输入一张 28×28 灰度图（比如数字 5） 。

less 复制代码

model.add(tf.layers.conv2d({
  inputShape: [28, 28, 1],
  filters: 32,
  kernelSize: 3,
  activation: 'relu'
}));

👉 类比：

就像小孩第一次看图画时，能分辨出哪里是"黑线"和"白底"。

less 复制代码

model.add(tf.layers.conv2d({
  filters: 64,
  kernelSize: 3,
  activation: 'relu'
}));

👉 类比：

像小孩第二次看画时，能分辨"这是弯弯的线条"，"这块像个三角形"。

less 复制代码

model.add(tf.layers.conv2d({
  filters: 128,
  kernelSize: 3,
  activation: 'relu'
}));

👉 类比：

小孩这时可以认出："这个弯曲+竖线，像数字 5 的结构。"

csharp 复制代码

model.add(tf.layers.flatten());

👉 类比：

就像把"拼图"的每块拆开排成一排，方便后面的大脑分析。

less 复制代码

model.add(tf.layers.dense({units: 128, activation: 'relu'}));

输入/输出形状：
- 输入 [61952]
- 输出 [128]
含义：
- Dense 层像"大脑"，把所有特征综合起来。
- 每个神经元会学一种组合方式，比如：
  - 神经元 1：边缘+弯曲 → "像数字 3"
  - 神经元 2：直线+横线 → "像数字 7"

👉 类比：

这一步就像大脑在判断"这个图像最像哪个数字"。

less 复制代码

model.add(tf.layers.dense({units: 10, activation: 'softmax'}));

👉 类比：

小孩最后说："这一定是数字 3！"

✅ 总结：

👉 类比一句话：
卷积层像眼睛逐层看细节，Flatten 把眼睛看到的东西排好，全连接层像大脑整合后做判断。