IT数学基础番外1--手算梯度下降（TODO）

fanged2026-02-24 10:41

1. 最简模型：只有 1 个神经元

输入：x输出：ypred真实值：ytrue

公式：ypred=w⋅x+b

要学的东西：

目标： 让预测值和真实值尽量一样，也就是损失最小 。我们用最简单的损失：均方误差Loss=21(ypred−ytrue)2

我们就用一组数据算：

随便给个初始值：

ypred=0.5⋅1+0.5=1.0

真实值是 2，差得远。现在要用梯度下降改 w 和 b。

梯度下降的核心：对 Loss 求 w 和 b 的偏导，知道往哪改。

推导一下（很简单）：∂w∂Loss=(ypred−ytrue)⋅x∂b∂Loss=ypred−ytrue

代入数值：ypred−ytrue=1−2=−1

∂w∂Loss=−1⋅1=−1∂b∂Loss=−1

wnew=wold−η⋅∂w∂Lossbnew=bold−η⋅∂b∂Loss

η 是学习率，我们取 0.5。

wnew=0.5−0.5(−1)=0.5+0.5=1.0bnew=0.5−0.5(−1)=0.5+0.5=1.0

ypred=1.0⋅1+1.0=2.0

直接等于真实值！一次就完美收敛。

深度学习只是：

但梯度下降干的事完全没变：

不停地对 所有 w、b 求导然后一点点更新让 Loss 越来越小

你现在已经懂了深度学习最核心的原理。