ResNet 残差连接：通往深层网络的“高速公路”

图解说明：

本文将介绍深度学习领域的一个里程碑式 的发明------ResNet (残差网络)。

它的核心概念**"残差连接 (Residual Connection)"，听起来很高深，但其实它的原理简单得令人发指。正是这个简单的设计，让神经网络从几十层一下子突破到了上千层**，彻底改变了 AI 的发展轨迹。

如果你完全不懂算法，没关系。我们用一个**"传话游戏"**的例子来拆解它。

在 ResNet 出现之前（2015年以前），科学家们发现了一个非常反直觉的现象：
神经网络并不是越深越好。

按理说，层数越多，脑子越复杂，应该越聪明对吧？

但实际上，当网络层数增加到一定程度（比如 20 层增加到 50 层）时，它的表现反而变差了！准确率不升反降。

这就像你给一个学生补课：

这就是著名的**"退化问题 (Degradation Problem)"**。因为层数太多，信息在传递过程中丢失了，或者被改乱了。

为了解决这个问题，微软的何恺明大神想出了一个绝妙的主意：
"如果你学不会新的东西，至少别把旧的东西忘了！"

他在网络里加了一条**"捷径" (Shortcut)，也叫"跳跃连接" (Skip Connection)**。

假设每一层网络都是一个学生，他们在接力处理信息。

普通网络：
- 学生 A 算出结果，传给学生 B。
- 学生 B 拿着 A 的结果一顿乱改，传给学生 C。
- 如果 B 改错了，C 拿到的就是垃圾，后面的全完了。
ResNet (残差网络)：
- 学生 A 算出结果 xxx。
- 学生 B 依然要去处理 xxx，算出 F(x)F(x)F(x)。
- 关键点来了 ：在 B 把结果传给 C 之前，我们把 A 的原始结果 xxx 直接加过去！
- 最终结果 = B算出来的东西 F(x)F(x)F(x) + A原本的东西 xxx。

这就像是**"抄作业"**：

学生 B 对老师说："老师，这是我自己算的答案 F(x)F(x)F(x)，但我怕算错了，所以我把上一位同学的正确答案 xxx 也附在后面。您看着办。"

这个简单的 F(x)+xF(x) + xF(x)+x 带来了两个巨大的好处：

如果学生 B 这一层是个笨蛋，什么都没学会（F(x)F(x)F(x) 是 0 或乱码），没关系！

因为有 +x+x+x 在，输出结果至少还是 xxx（上一层的水平）。

这就保证了：加深网络，最差也就是原地踏步，绝对不会变差（退化）。

还记得我们之前说的**"梯度消失"**吗？

在普通网络里，当老师（输出层）发现错了，想把修正意见（梯度）传回给第 1 层的学生时，必须一层一层往回传。

ResNet 的捷径 ，就像是在市区旁边修了一条直达的高速公路。

ResNet (残差连接) 就是给神经网络装上了**"记忆保持器"**：

下次看到 ResNet，别被名字唬住，记得它就是那个**"允许抄上一层作业"**的机智网络！🛣️